from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"

import numpy as np

# Define the range [a, b]
a, b = 0, 10
size = 10000  

# Generate random samples from the Uniform distribution
samples = np.random.uniform(a, b, size)

# Print the first 10 samples as a quick check
print(samples[:10])

[6.15006009 2.01955042 8.74049354 9.47215616 2.28858156 8.93434819
 3.72915351 2.82670165 7.40624931 8.9659028 ]

import scipy.stats as stats

# 1. Probability Density Function (PDF)
x = np.linspace(a, b, 100)
pdf_values = stats.uniform.pdf(x, a, b-a)

# 2. Cumulative Distribution Function (CDF)
cdf_values = stats.uniform.cdf(x, a, b-a)

# 3. Expected Value (Mean), Variance, and Standard Deviation
mean = np.mean(samples)
variance = np.var(samples)
std_dev = np.std(samples)

# 4. Skewness and Kurtosis
skewness = stats.skew(samples)
kurtosis = stats.kurtosis(samples)

print(f"Mean: {mean}, Variance: {variance}, Std Dev: {std_dev}")
print(f"Skewness: {skewness}, Kurtosis: {kurtosis}")

Mean: 5.023989252427546, Variance: 8.353395015977735, Std Dev: 2.8902240425229557
Skewness: -0.02065987662210745, Kurtosis: -1.203986225470313

# 5. Moments of Distribution
moment_1 = stats.moment(samples, moment=1)
moment_2 = stats.moment(samples, moment=2)
moment_3 = stats.moment(samples, moment=3)
moment_4 = stats.moment(samples, moment=4)

# Print results
print(f"Moments: 1st={moment_1}, 2nd={moment_2}, 3rd={moment_3}, 4th={moment_4}")

Moments: 1st=0.0, 2nd=8.353395015977735, 3rd=-0.49879518435618814, 4th=125.32441926993532

import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats
import seaborn as sns

def plot_distribution(samples, distribution_name, dist_func=None, params=None, discrete=False):
    """
    General function to visualize a distribution.
    
    Args:
        samples (np.array): The generated random samples.
        distribution_name (str): Name of the distribution (for title/labels).
        dist_func (scipy.stats distribution, optional): Distribution function from scipy.stats (e.g., stats.norm).
        params (tuple, optional): Parameters for the distribution function (e.g., (mean, std) for normal).
        discrete (bool): Set to True for discrete distributions.
    """

    fig, axs = plt.subplots(1, 3, figsize=(18, 5))
    
    # 1️⃣ Histogram vs. Theoretical Distribution (PMF/PDF)
    axs[0].hist(samples, bins=50 if not discrete else np.arange(min(samples), max(samples) + 1.5) - 0.5,
                density=True, alpha=0.6, color='blue', edgecolor='black', label="Sampled Data")
    
    if dist_func and params:
        x = np.linspace(min(samples), max(samples), 100) if not discrete else np.arange(min(samples), max(samples) + 1)
        if discrete:
            y = dist_func.pmf(x, *params)
        else:
            y = dist_func.pdf(x, *params)
        axs[0].plot(x, y, 'r-', label="Theoretical")
    
    axs[0].set_title(f"Histogram vs. Theoretical {distribution_name}")
    axs[0].set_xlabel("Value")
    axs[0].set_ylabel("Density / Probability")
    axs[0].legend()

    # 2️⃣ CDF Plot
    sorted_samples = np.sort(samples)
    empirical_cdf = np.arange(1, len(sorted_samples) + 1) / len(sorted_samples)
    axs[1].plot(sorted_samples, empirical_cdf, marker="o", linestyle="none", label="Empirical CDF")
    
    if dist_func and params:
        theoretical_cdf = dist_func.cdf(sorted_samples, *params)
        axs[1].plot(sorted_samples, theoretical_cdf, 'r-', label="Theoretical CDF")
    
    axs[1].set_title(f"CDF of {distribution_name}")
    axs[1].set_xlabel("Value")
    axs[1].set_ylabel("Cumulative Probability")
    axs[1].legend()

    # 3️⃣ QQ-Plot (for normality check)
    stats.probplot(samples, dist="norm", plot=axs[2])
    axs[2].set_title(f"QQ-Plot for {distribution_name}")

    plt.tight_layout()
    plt.show()

plot_distribution(samples, "Uniform Distribution", stats.uniform, (0, 10))

def mle_uniform(samples):
    """ MLE for Uniform Distribution: Estimates a (min) and b (max) """
    estimated_a = np.min(samples)
    estimated_b = np.max(samples)
    return estimated_a, estimated_b

# Example usage
estimated_a, estimated_b = mle_uniform(samples)
print(f"MLE Estimated a: {estimated_a}, b: {estimated_b}")

MLE Estimated a: 0.00012401492256564062, b: 9.999474522065132

def mom_uniform(samples):
    """ MoM for Uniform Distribution: Estimates a (min) and b (max) """
    sample_mean = np.mean(samples)
    sample_var = np.var(samples)

    estimated_a = sample_mean - np.sqrt(3 * sample_var)
    estimated_b = sample_mean + np.sqrt(3 * sample_var)
    
    return estimated_a, estimated_b

# Example usage
estimated_a, estimated_b = mom_uniform(samples)
print(f"MoM Estimated a: {estimated_a}, b: {estimated_b}")

MoM Estimated a: 0.01797436552067566, b: 10.030004139334416

import scipy.stats as stats

def bayesian_uniform(samples, prior_range=(0, 20)):
    """ Bayesian estimation for Uniform Distribution using weakly informative priors """
    prior_a = stats.uniform(0, prior_range[1])  # Prior for a
    prior_b = stats.uniform(0, prior_range[1])  # Prior for b

    estimated_a = np.min(samples)  # Approximate MAP estimate
    estimated_b = np.max(samples)

    return estimated_a, estimated_b

# Example usage
estimated_a, estimated_b = bayesian_uniform(samples)
print(f"Bayesian Estimated a: {estimated_a}, b: {estimated_b}")

Bayesian Estimated a: 0.00012401492256564062, b: 9.999474522065132

import numpy as np

# Define parameters
mean = 0    
std_dev = 1  
size = 10000  

# Generate samples
samples = np.random.normal(mean, std_dev, size)

# Print first 10 samples
print(samples[:10])

[ 0.20672578  1.49442918 -0.43596802  1.21474981 -1.3871113  -0.19308278
 -1.46968594 -0.40598727 -0.32720846 -1.40650569]

# Define x range
x = np.linspace(min(samples), max(samples), 100)

# 1. Probability Density Function (PDF)
pdf_values = stats.norm.pdf(x, np.mean(samples), np.std(samples))

# 2. Cumulative Distribution Function (CDF)
cdf_values = stats.norm.cdf(x, np.mean(samples), np.std(samples))

# 3. Expected Value (Mean), Variance, and Standard Deviation
mean = np.mean(samples)
variance = np.var(samples)
std_dev = np.std(samples)

# 4. Skewness and Kurtosis
skewness = stats.skew(samples)
kurtosis = stats.kurtosis(samples)

print(f"Mean: {mean}, Variance: {variance}, Std Dev: {std_dev}")
print(f"Skewness: {skewness}, Kurtosis: {kurtosis}")

Mean: 0.00855746521401197, Variance: 1.0013805234096436, Std Dev: 1.000690023638511
Skewness: 0.034754230943357105, Kurtosis: -0.0020254212394203996

# 5. Moments of Distribution
moment_1 = stats.moment(samples, moment=1)
moment_2 = stats.moment(samples, moment=2)
moment_3 = stats.moment(samples, moment=3)
moment_4 = stats.moment(samples, moment=4)

# Print results
print(f"Moments: 1st={moment_1}, 2nd={moment_2}, 3rd={moment_3}, 4th={moment_4}")

Moments: 1st=0.0, 2nd=1.0013805234096436, 3rd=0.03482622432031219, 4th=3.0062578406100853

plot_distribution(samples, "Normal Distribution", stats.norm, (np.mean(samples), np.std(samples)))

import numpy as np
import scipy.stats as stats
from scipy.optimize import minimize

def mle_normal(samples):
    """ MLE for Normal Distribution """
    def neg_log_likelihood(params):
        mu, sigma = params
        return -np.sum(stats.norm.logpdf(samples, mu, sigma))
    
    init_params = [np.mean(samples), np.std(samples)]
    result = minimize(neg_log_likelihood, init_params, method="L-BFGS-B")
    return result.x  # [estimated_mu, estimated_sigma]

# Example usage
estimated_mu, estimated_sigma = mle_normal(samples)
print(f"MLE Estimated μ: {estimated_mu}, σ: {estimated_sigma}")

MLE Estimated μ: 0.00855746521401197, σ: 1.000690023638511

from scipy.optimize import minimize

def mle_normal(samples):
    """ MLE for Normal Distribution: Estimates mean and std deviation """
    def neg_log_likelihood(params):
        mu, sigma = params
        return -np.sum(stats.norm.logpdf(samples, mu, sigma))
    
    init_params = [np.mean(samples), np.std(samples)]
    result = minimize(neg_log_likelihood, init_params, method="L-BFGS-B")
    return result.x  # [estimated_mu, estimated_sigma]

# Example usage
estimated_mu, estimated_sigma = mle_normal(samples)
print(f"MLE Estimated μ: {estimated_mu}, σ: {estimated_sigma}")

MLE Estimated μ: 0.00855746521401197, σ: 1.000690023638511

def mom_normal(samples):
    """ MoM for Normal Distribution: Estimates mean and std deviation """
    estimated_mu = np.mean(samples)
    estimated_sigma = np.std(samples)
    return estimated_mu, estimated_sigma

# Example usage
estimated_mu, estimated_sigma = mom_normal(samples)
print(f"MoM Estimated μ: {estimated_mu}, σ: {estimated_sigma}")

MoM Estimated μ: 0.00855746521401197, σ: 1.000690023638511

def bayesian_normal(samples, prior_mu=0, prior_sigma=10):
    """ Bayesian estimation for Normal Distribution using Normal-Gamma prior """
    n = len(samples)
    sample_mean = np.mean(samples)
    sample_var = np.var(samples)

    posterior_mu = (prior_mu + n * sample_mean) / (n + 1)
    posterior_sigma = np.sqrt(sample_var / (n + 1))

    return posterior_mu, posterior_sigma

# Example usage
estimated_mu, estimated_sigma = bayesian_normal(samples)
print(f"Bayesian Estimated μ: {estimated_mu}, σ: {estimated_sigma}")

Bayesian Estimated μ: 0.008556609553056664, σ: 0.010006399928896039

import numpy as np

# Define parameter
lambda_ = 1.0  # Rate parameter (1/mean)
size = 10000  

# Generate samples
samples = np.random.exponential(1/lambda_, size)

# Print first 10 samples
print(samples[:10])

[1.36735139 1.40136367 3.07237766 0.06854029 0.8597998  2.22200155
 0.7021894  2.30098052 1.52858119 0.84323414]

# Define x range
x = np.linspace(min(samples), max(samples), 100)

# 1. Probability Density Function (PDF)
pdf_values = stats.expon.pdf(x, scale=np.mean(samples))

# 2. Cumulative Distribution Function (CDF)
cdf_values = stats.expon.cdf(x, scale=np.mean(samples))

# 3. Expected Value (Mean), Variance, and Standard Deviation
mean = np.mean(samples)
variance = np.var(samples)
std_dev = np.std(samples)

# 4. Skewness and Kurtosis
skewness = stats.skew(samples)
kurtosis = stats.kurtosis(samples)

print(f"Mean: {mean}, Variance: {variance}, Std Dev: {std_dev}")
print(f"Skewness: {skewness}, Kurtosis: {kurtosis}")

Mean: 1.020200968484339, Variance: 1.0212674359615939, Std Dev: 1.0105777733364185
Skewness: 2.010606218830984, Kurtosis: 6.041510948783317

# 5. Moments of Distribution
moment_1 = stats.moment(samples, moment=1)
moment_2 = stats.moment(samples, moment=2)
moment_3 = stats.moment(samples, moment=3)
moment_4 = stats.moment(samples, moment=4)

# Print results
print(f"Moments: 1st={moment_1}, 2nd={moment_2}, 3rd={moment_3}, 4th={moment_4}")

Moments: 1st=0.0, 2nd=1.0212674359615939, 3rd=2.0750867049170814, 4th=9.43017996903456

plot_distribution(samples, "Exponential Distribution", stats.expon, (0, np.mean(samples)))

def mle_exponential(samples):
    """ MLE for Exponential Distribution: Estimates lambda (rate parameter) """
    estimated_lambda = 1 / np.mean(samples)
    return estimated_lambda

# Example usage
estimated_lambda = mle_exponential(samples)
print(f"MLE Estimated λ: {estimated_lambda}")

MLE Estimated λ: 0.9801990302809156

def mom_exponential(samples):
    """ MoM for Exponential Distribution: Estimates lambda (rate parameter) """
    sample_mean = np.mean(samples)
    estimated_lambda = 1 / sample_mean
    return estimated_lambda

# Example usage
estimated_lambda = mom_exponential(samples)
print(f"MoM Estimated λ: {estimated_lambda}")

MoM Estimated λ: 0.9801990302809156

def bayesian_exponential(samples, alpha_prior=1, beta_prior=1):
    """ Bayesian estimation for Exponential Distribution using Gamma prior """
    n = len(samples)
    posterior_alpha = alpha_prior + n
    posterior_beta = beta_prior + np.sum(samples)

    return posterior_alpha, posterior_beta

# Example usage
posterior_alpha, posterior_beta = bayesian_exponential(samples)
print(f"Bayesian Estimated λ ~ Gamma({posterior_alpha}, {posterior_beta})")

Bayesian Estimated λ ~ Gamma(10001, 10203.00968484339)

import numpy as np

# Define degrees of freedom
df = 4  
size = 10000  

# Generate samples
samples = np.random.chisquare(df, size)

# Print first 10 samples
print(samples[:10])

[7.7014732  4.10197928 3.83680242 2.85876994 5.19336467 3.58272035
 2.13084351 5.93104515 2.22389492 9.70735753]

# Define x range
x = np.linspace(min(samples), max(samples), 100)

# Degrees of freedom (df) estimated from sample mean
df = np.mean(samples)

# 1. Probability Density Function (PDF)
pdf_values = stats.chi2.pdf(x, df)

# 2. Cumulative Distribution Function (CDF)
cdf_values = stats.chi2.cdf(x, df)

# 3. Expected Value (Mean), Variance, and Standard Deviation
mean = np.mean(samples)
variance = np.var(samples)
std_dev = np.std(samples)

# 4. Skewness and Kurtosis
skewness = stats.skew(samples)
kurtosis = stats.kurtosis(samples)

print(f"Mean: {mean}, Variance: {variance}, Std Dev: {std_dev}")
print(f"Skewness: {skewness}, Kurtosis: {kurtosis}")

Mean: 3.9898534604541624, Variance: 7.766719440448182, Std Dev: 2.786883463736541
Skewness: 1.3500866916257097, Kurtosis: 2.602689674298989

# 5. Moments of Distribution
moment_1 = stats.moment(samples, moment=1)
moment_2 = stats.moment(samples, moment=2)
moment_3 = stats.moment(samples, moment=3)
moment_4 = stats.moment(samples, moment=4)

# Print results
print(f"Moments: 1st={moment_1}, 2nd={moment_2}, 3rd={moment_3}, 4th={moment_4}")

Moments: 1st=0.0, 2nd=7.766719440448182, 3rd=29.222548102897616, 4th=337.96505920027744

plot_distribution(samples, "Chi-Square Distribution", stats.chi2, (np.mean(samples),))

def mle_chi_square(samples):
    """ MLE for Chi-Square Distribution: Estimates degrees of freedom (df) """
    estimated_df = np.mean(samples)
    return estimated_df

# Example usage
estimated_df = mle_chi_square(samples)
print(f"MLE Estimated df: {estimated_df}")

MLE Estimated df: 3.9898534604541624

def mom_chi_square(samples):
    """ MoM for Chi-Square Distribution: Estimates degrees of freedom (df) """
    estimated_df = np.mean(samples)
    return estimated_df

# Example usage
estimated_df = mom_chi_square(samples)
print(f"MoM Estimated df: {estimated_df}")

MoM Estimated df: 3.9898534604541624

def bayesian_chi_square(samples, alpha_prior=1, beta_prior=1):
    """ Bayesian estimation for Chi-Square Distribution using Gamma prior """
    n = len(samples)
    posterior_alpha = alpha_prior + n / 2
    posterior_beta = beta_prior + np.sum(samples) / 2

    return posterior_alpha, posterior_beta

# Example usage
posterior_alpha, posterior_beta = bayesian_chi_square(samples)
print(f"Bayesian Estimated df ~ Gamma({posterior_alpha}, {posterior_beta})")

Bayesian Estimated df ~ Gamma(5001.0, 19950.26730227081)

import numpy as np

# Define degrees of freedom
df = 10  
size = 10000  

# Generate samples
samples = np.random.standard_t(df, size)

# Print first 10 samples
print(samples[:10])

[ 0.95997095  0.02408985  0.94758405 -0.56124673  0.31062648  1.53257115
 -0.94969413  0.53653212  0.82879488 -0.08124798]

# Define x range
x = np.linspace(min(samples), max(samples), 100)

# Degrees of freedom (df) estimated from sample variance
df = len(samples) - 1

# 1. Probability Density Function (PDF)
pdf_values = stats.t.pdf(x, df)

# 2. Cumulative Distribution Function (CDF)
cdf_values = stats.t.cdf(x, df)

# 3. Expected Value (Mean), Variance, and Standard Deviation
mean = np.mean(samples)
variance = np.var(samples)
std_dev = np.std(samples)

# 4. Skewness and Kurtosis
skewness = stats.skew(samples)
kurtosis = stats.kurtosis(samples)

print(f"Mean: {mean}, Variance: {variance}, Std Dev: {std_dev}")
print(f"Skewness: {skewness}, Kurtosis: {kurtosis}")

Mean: -0.0041044185014767936, Variance: 1.2711281274716946, Std Dev: 1.127443181482639
Skewness: -0.083782486753158, Kurtosis: 1.015875862817735

# 5. Moments of Distribution
moment_1 = stats.moment(samples, moment=1)
moment_2 = stats.moment(samples, moment=2)
moment_3 = stats.moment(samples, moment=3)
moment_4 = stats.moment(samples, moment=4)

# Print results
print(f"Moments: 1st={moment_1}, 2nd={moment_2}, 3rd={moment_3}, 4th={moment_4}")

Moments: 1st=0.0, 2nd=1.2711281274716946, 3rd=-0.1200707545537849, 4th=6.488718556534603

plot_distribution(samples, "Student's t-Distribution", stats.t, (len(samples) - 1,))

def mle_student_t(samples):
    """ MLE for Student's t-Distribution: Estimates degrees of freedom (df) """
    def neg_log_likelihood(df):
        return -np.sum(stats.t.logpdf(samples, df))
    
    result = minimize(neg_log_likelihood, x0=[10], method="L-BFGS-B", bounds=[(1, None)])
    return result.x[0]

# Example usage
estimated_df = mle_student_t(samples)
print(f"MLE Estimated df: {estimated_df}")

MLE Estimated df: 9.494047522949206

def mom_student_t(samples):
    """ MoM for Student's t-Distribution: Estimates degrees of freedom (df) """
    sample_var = np.var(samples)
    
    def solve_df(df):
        return df / (df - 2) - sample_var  # Equation to solve

    from scipy.optimize import fsolve
    estimated_df = fsolve(solve_df, x0=10)[0]
    return estimated_df

# Example usage
estimated_df = mom_student_t(samples)
print(f"MoM Estimated df: {estimated_df}")

MoM Estimated df: 9.37658618694521

def bayesian_student_t(samples, alpha_prior=1, beta_prior=1):
    """ Bayesian estimation for Student's t-Distribution using Gamma prior """
    n = len(samples)
    posterior_alpha = alpha_prior + n / 2
    posterior_beta = beta_prior + np.sum(samples**2) / 2

    return posterior_alpha, posterior_beta

# Example usage
posterior_alpha, posterior_beta = bayesian_student_t(samples)
print(f"Bayesian Estimated df ~ Gamma({posterior_alpha}, {posterior_beta})")

Bayesian Estimated df ~ Gamma(5001.0, 6356.724868614649)

import numpy as np

# Define parameter
lambda_ = 3  # Average number of events per interval
size = 10000  

# Generate samples
samples = np.random.poisson(lambda_, size)

# Print first 10 samples
print(samples[:10])

[2 6 1 1 3 2 0 4 1 2]

# Define x range (only integer values for discrete distribution)
x = np.arange(min(samples), max(samples)+1)

# Lambda estimated as sample mean
lambda_ = np.mean(samples)

# 1. Probability Mass Function (PMF)
pmf_values = stats.poisson.pmf(x, lambda_)

# 2. Cumulative Distribution Function (CDF)
cdf_values = stats.poisson.cdf(x, lambda_)

# 3. Expected Value (Mean), Variance, and Standard Deviation
mean = np.mean(samples)
variance = np.var(samples)
std_dev = np.std(samples)

# 4. Skewness and Kurtosis
skewness = stats.skew(samples)
kurtosis = stats.kurtosis(samples)

print(f"Mean: {mean}, Variance: {variance}, Std Dev: {std_dev}")
print(f"Skewness: {skewness}, Kurtosis: {kurtosis}")

Mean: 3.0215, Variance: 3.02443775, Std Dev: 1.7390910700708
Skewness: 0.5823091626456441, Kurtosis: 0.27761848737155503

# 5. Moments of Distribution
moment_1 = stats.moment(samples, moment=1)
moment_2 = stats.moment(samples, moment=2)
moment_3 = stats.moment(samples, moment=3)
moment_4 = stats.moment(samples, moment=4)

# Print results
print(f"Moments: 1st={moment_1}, 2nd={moment_2}, 3rd={moment_3}, 4th={moment_4}")

Moments: 1st=0.0, 2nd=3.02443775, 3rd=3.0628138267499994, 4th=29.98110951912481

plot_distribution(samples, "Poisson Distribution", stats.poisson, (np.mean(samples),), discrete=True)

def mle_poisson(samples):
    """ MLE for Poisson Distribution: Estimates lambda (mean rate of occurrences) """
    estimated_lambda = np.mean(samples)
    return estimated_lambda

# Example usage
estimated_lambda = mle_poisson(samples)
print(f"MLE Estimated λ: {estimated_lambda}")

MLE Estimated λ: 3.0215

def mom_poisson(samples):
    """ MoM for Poisson Distribution: Estimates lambda (mean rate of occurrences) """
    estimated_lambda = np.mean(samples)
    return estimated_lambda

# Example usage
estimated_lambda = mom_poisson(samples)
print(f"MoM Estimated λ: {estimated_lambda}")

MoM Estimated λ: 3.0215

def bayesian_poisson(samples, alpha_prior=1, beta_prior=1):
    """ Bayesian estimation for Poisson Distribution using Gamma prior """
    posterior_alpha = alpha_prior + np.sum(samples)
    posterior_beta = beta_prior + len(samples)

    return posterior_alpha, posterior_beta

# Example usage
posterior_alpha, posterior_beta = bayesian_poisson(samples)
print(f"Bayesian Estimated λ ~ Gamma({posterior_alpha}, {posterior_beta})")

Bayesian Estimated λ ~ Gamma(30216, 10001)

import numpy as np

# Define probability of success
p = 0.5  
size = 10000  

# Generate samples (0 or 1 outcomes)
samples = np.random.binomial(1, p, size)

# Print first 10 samples
print(samples[:10])

[0 0 0 0 1 1 1 0 0 1]

# Define x values (0 and 1 only for Bernoulli)
x = np.array([0, 1])

# Probability of success (p) estimated from sample mean
p = np.mean(samples)

# 1. Probability Mass Function (PMF)
pmf_values = stats.bernoulli.pmf(x, p)

# 2. Cumulative Distribution Function (CDF)
cdf_values = stats.bernoulli.cdf(x, p)

# 3. Expected Value (Mean), Variance, and Standard Deviation
mean = np.mean(samples)
variance = np.var(samples)
std_dev = np.std(samples)

# 4. Skewness and Kurtosis
skewness = stats.skew(samples)
kurtosis = stats.kurtosis(samples)

print(f"Mean: {mean}, Variance: {variance}, Std Dev: {std_dev}")
print(f"Skewness: {skewness}, Kurtosis: {kurtosis}")

Mean: 0.502, Variance: 0.2499959999999999, Std Dev: 0.4999959999839998
Skewness: -0.008000064000768024, Kurtosis: -1.9999359989759826

# 5. Moments of Distribution
moment_1 = stats.moment(samples, moment=1)
moment_2 = stats.moment(samples, moment=2)
moment_3 = stats.moment(samples, moment=3)
moment_4 = stats.moment(samples, moment=4)

# Print results
print(f"Moments: 1st={moment_1}, 2nd={moment_2}, 3rd={moment_3}, 4th={moment_4}")

Moments: 1st=0.0, 2nd=0.2499959999999999, 3rd=-0.0009999840000000013, 4th=0.06250199995200002

plot_distribution(samples, "Bernoulli Distribution", stats.bernoulli, (np.mean(samples),), discrete=True)

def mle_bernoulli(samples):
    """ MLE for Bernoulli Distribution: Estimates probability of success (p) """
    estimated_p = np.mean(samples)
    return estimated_p

# Example usage
estimated_p = mle_bernoulli(samples)
print(f"MLE Estimated p: {estimated_p}")

MLE Estimated p: 0.502

def mom_bernoulli(samples):
    """ MoM for Bernoulli Distribution: Estimates probability of success (p) """
    estimated_p = np.mean(samples)
    return estimated_p

# Example usage
estimated_p = mom_bernoulli(samples)
print(f"MoM Estimated p: {estimated_p}")

MoM Estimated p: 0.502

def bayesian_bernoulli(samples, alpha_prior=1, beta_prior=1):
    """ Bayesian estimation for Bernoulli Distribution using Beta prior """
    successes = np.sum(samples)
    failures = len(samples) - successes

    posterior_alpha = alpha_prior + successes
    posterior_beta = beta_prior + failures

    return posterior_alpha, posterior_beta

# Example usage
posterior_alpha, posterior_beta = bayesian_bernoulli(samples)
print(f"Bayesian Estimated p ~ Beta({posterior_alpha}, {posterior_beta})")

Bayesian Estimated p ~ Beta(5021, 4981)

import numpy as np

# Define parameters
n = 10   # Number of trials
p = 0.5  # Probability of success
size = 10000  

# Generate samples
samples = np.random.binomial(n, p, size)

# Print first 10 samples
print(samples[:10])

[5 5 8 3 2 6 2 6 7 4]

# Define x range (integer values from 0 to max observed trials)
x = np.arange(min(samples), max(samples)+1)

# Number of trials (n) estimated as max observed value
n = max(samples)

# Probability of success (p) estimated from sample mean divided by n
p = np.mean(samples) / n

# 1. Probability Mass Function (PMF)
pmf_values = stats.binom.pmf(x, n, p)

# 2. Cumulative Distribution Function (CDF)
cdf_values = stats.binom.cdf(x, n, p)

# 3. Expected Value (Mean), Variance, and Standard Deviation
mean = np.mean(samples)
variance = np.var(samples)
std_dev = np.std(samples)

# 4. Skewness and Kurtosis
skewness = stats.skew(samples)
kurtosis = stats.kurtosis(samples)

print(f"Mean: {mean}, Variance: {variance}, Std Dev: {std_dev}")
print(f"Skewness: {skewness}, Kurtosis: {kurtosis}")

Mean: 4.9863, Variance: 2.5325123099999995, Std Dev: 1.591386913984151
Skewness: -0.018661863682399617, Kurtosis: -0.18734032169495052

# 5. Moments of Distribution
moment_1 = stats.moment(samples, moment=1)
moment_2 = stats.moment(samples, moment=2)
moment_3 = stats.moment(samples, moment=3)
moment_4 = stats.moment(samples, moment=4)

# Print results
print(f"Moments: 1st={moment_1}, 2nd={moment_2}, 3rd={moment_3}, 4th={moment_4}")

Moments: 1st=0.0, 2nd=2.5325123099999995, 3rd=-0.0752111727059997, 4th=18.039326429095393

plot_distribution(samples, "Binomial Distribution", stats.binom, (max(samples), np.mean(samples) / max(samples)), discrete=True)

def mle_binomial(samples, n):
    """ MLE for Binomial Distribution: Estimates probability of success (p) given n trials """
    estimated_p = np.mean(samples) / n
    return estimated_p

# Example usage
n = max(samples)  # Assuming n is the max observed value
estimated_p = mle_binomial(samples, n)
print(f"MLE Estimated p: {estimated_p} (given n={n})")

MLE Estimated p: 0.49863 (given n=10)

def mom_binomial(samples, n):
    """ MoM for Binomial Distribution: Estimates probability of success (p) given n trials """
    sample_mean = np.mean(samples)
    sample_var = np.var(samples)

    estimated_p = sample_mean / n
    return estimated_p

# Example usage
n = max(samples)  # Assuming n is the max observed value
estimated_p = mom_binomial(samples, n)
print(f"MoM Estimated p: {estimated_p} (given n={n})")

MoM Estimated p: 0.49863 (given n=10)

from scipy.stats import beta

def bayesian_bernoulli(samples, alpha_prior=1, beta_prior=1):
    """ Bayesian estimation for Bernoulli distribution """
    successes = np.sum(samples)  # Number of 1s (successes)
    failures = len(samples) - successes  # Number of 0s (failures)
    
    posterior_alpha = alpha_prior + successes
    posterior_beta = beta_prior + failures
    
    return posterior_alpha, posterior_beta

# Example usage
posterior_alpha, posterior_beta = bayesian_bernoulli(samples)
print(f"Posterior Beta(α, β): α={posterior_alpha}, β={posterior_beta}")

Posterior Beta(α, β): α=49864, β=-39862

def bayesian_binomial(samples, n, alpha_prior=1, beta_prior=1):
    """ Bayesian estimation for Binomial Distribution using Beta prior """
    successes = np.sum(samples)

    posterior_alpha = alpha_prior + successes
    posterior_beta = beta_prior + (n * len(samples) - successes)

    return posterior_alpha, posterior_beta

# Example usage
n = max(samples)  # Assuming n is the max observed value
posterior_alpha, posterior_beta = bayesian_binomial(samples, n)
print(f"Bayesian Estimated p ~ Beta({posterior_alpha}, {posterior_beta})")

Bayesian Estimated p ~ Beta(49864, 50138)

📖 Table of Contents¶

⚙️ Setup¶

📌 Glossary¶

🧠 Basic Concepts¶

🎲 Types of Random Variables¶

🎯 Probability¶

📐 Distribution-Specific Terms¶

🧠 Estimation & Inference¶

💼 Applications in Data Science¶

📐 Continuous Distributions¶

📊 Uniform¶

Sample from Distribution¶

Key Properties¶

Visualizing Distributions¶

Parameter Estimation¶

📈 Normal¶

Sample from Distribution¶

Key Properties¶

Visualizing Distributions¶

Parameter Estimation¶

⏱️ Exponential¶

Sample from Distribution¶

Key Properties¶

Visualizing Distributions¶

Parameter Estimation¶

📦 Chi Square¶

Sample from Distribution¶

Key Properties¶

Visualizing Distributions¶

Parameter Estimation¶

📘 Student t¶

Sample from Distribution¶

Key Properties¶

Visualizing Distributions¶

Parameter Estimation¶

🎲 Discrete Distributions¶

🔔 Poisson¶

Sample from Distribution¶

Key Properties¶

Visualizing Distributions¶

Parameter Estimation¶

⚪ Bernoulli¶

Sample from Distribution¶

Key Properties¶

Visualizing Distributions¶

Parameter Estimation¶

🎯 Binomial¶

Sample from Distribution¶

Key Properties¶

Visualizing Distributions¶

Parameter Estimation¶