深入解析常见概率分布:从期望到方差全面掌握

概率分布的期望、方差和分布函数

在概率论与统计学中,不同的分布有其各自的数学特性。每种分布的期望(数学期望)表达了该随机变量在长期试验中所期望的平均值。以下我们对几种常见分布进行详细介绍,包含它们的定义、期望、方差和分布函数。

1. 均匀分布 (Uniform Distribution)

  • 定义:如果随机变量 X X X在区间 [ a , b ] [a, b] [a,b]上均匀分布,记为 X ∼ U ( a , b ) X \sim U(a, b) XU(a,b)。均匀分布意味着在 [ a , b ] [a, b] [a,b]区间内任何一个子区间内的数值出现的概率是相等的。
  • 概率密度函数 f ( x ) = 1 b − a , a ≤ x ≤ b f(x) = \frac{1}{b-a}, \quad a \le x \le b f(x)=ba1,axb
  • 期望 E ( X ) = a + b 2 E(X) = \frac{a + b}{2} E(X)=2a+b
  • 方差 Var ( X ) = ( b − a ) 2 12 \text{Var}(X) = \frac{(b - a)^2}{12} Var(X)=12(ba)2
  • 分布函数
    F ( x ) = { 0 if  x < a x − a b − a if  a ≤ x ≤ b 1 if  x > b F(x) = \begin{cases} 0 & \text{if } x < a \\ \frac{x - a}{b - a} & \text{if } a \leq x \leq b \\ 1 & \text{if } x > b \end{cases} F(x)= 0baxa1if x<aif axbif x>b
  • 性质:均匀分布是最简单的连续分布之一,主要用于表示等可能性事件。例如,生成伪随机数时,通常使用均匀分布。

2. 指数分布 (Exponential Distribution)

  • 定义:如果随机变量 X X X的出现时间服从指数分布,记为 X ∼ E ( λ ) X \sim E(\lambda) XE(λ),其中参数 λ > 0 \lambda > 0 λ>0是事件发生的速率。
  • 概率密度函数 f ( x ) = λ e − λ x , x ≥ 0 f(x) = \lambda e^{-\lambda x}, \quad x \ge 0 f(x)=λeλx,x0
  • 期望 E ( X ) = 1 λ E(X) = \frac{1}{\lambda} E(X)=λ1
  • 方差 Var ( X ) = 1 λ 2 \text{Var}(X) = \frac{1}{\lambda^2} Var(X)=λ21
  • 分布函数
    F ( x ) = { 0 if  x < 0 1 − e − λ x if  x ≥ 0 F(x) = \begin{cases} 0 & \text{if } x < 0 \\ 1 - e^{-\lambda x} & \text{if } x \geq 0 \end{cases} F(x)={01eλxif x<0if x0
  • 性质:指数分布是无记忆性的,即 P ( X > s + t ∣ X > s ) = P ( X > t ) P(X > s + t | X > s) = P(X > t) P(X>s+tX>s)=P(X>t),表示一个事件发生的概率与过去的发生情况无关。广泛应用于等待时间模型中,如排队理论和生存分析。

3. 正态分布 (Normal Distribution)

  • 定义:如果随机变量 X X X服从均值为 μ \mu μ,方差为 σ 2 \sigma^2 σ2的正态分布,记为 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) XN(μ,σ2)。正态分布广泛出现在自然和社会科学中,是最重要的连续分布之一。
  • 概率密度函数 f ( x ) = 1 2 π σ 2 e − ( x − μ ) 2 2 σ 2 f(x) = \frac{1}{\sqrt{2\pi \sigma^2}} e^{-\frac{(x - \mu)^2}{2\sigma^2}} f(x)=2πσ2 1e2σ2(xμ)2
  • 期望 E ( X ) = μ E(X) = \mu E(X)=μ
  • 方差 Var ( X ) = σ 2 \text{Var}(X) = \sigma^2 Var(X)=σ2
  • 分布函数
    F ( x ) = 1 2 π σ 2 ∫ − ∞ x e − ( t − μ ) 2 2 σ 2   d t = Φ ( x − μ σ ) F(x) = \frac{1}{\sqrt{2\pi\sigma^2}} \int_{-\infty}^{x} e^{-\frac{(t - \mu)^2}{2\sigma^2}} \, dt = \Phi\left(\frac{x - \mu}{\sigma}\right) F(x)=2πσ2 1xe2σ2(tμ)2dt=Φ(σxμ)
    其中, Φ ( z ) \Phi(z) Φ(z)是标准正态分布的分布函数。
  • 性质:正态分布的形状为钟形,对称分布,均值和中位数相等。正态分布的线性组合仍为正态分布,在中心极限定理中占有重要地位。

4. 二项分布 (Binomial Distribution)

  • 定义:如果随机变量 X X X表示 n n n次独立重复试验中成功的次数,且每次试验成功的概率为 p p p,则称 X X X服从二项分布,记为 X ∼ B ( n , p ) X \sim B(n, p) XB(n,p)
  • 概率质量函数 P ( X = k ) = ( n k ) p k ( 1 − p ) n − k , k = 0 , 1 , … , n P(X = k) = \binom{n}{k} p^k (1 - p)^{n - k}, \quad k = 0, 1, \ldots, n P(X=k)=(kn)pk(1p)nk,k=0,1,,n
  • 期望 E ( X ) = n p E(X) = np E(X)=np
  • 方差 Var ( X ) = n p ( 1 − p ) \text{Var}(X) = np(1 - p) Var(X)=np(1p)
  • 分布函数
    F ( x ) = ∑ k = 0 ⌊ x ⌋ ( n k ) p k ( 1 − p ) n − k F(x) = \sum_{k=0}^{\lfloor x \rfloor} \binom{n}{k} p^k (1 - p)^{n - k} F(x)=k=0x(kn)pk(1p)nk
    其中, ⌊ x ⌋ \lfloor x \rfloor x表示不超过 x x x的最大整数。
  • 性质:二项分布描述了独立重复试验中成功次数的分布情况,是离散分布的一种常见形式,在质量控制、决策分析中广泛应用。

5. 泊松分布 (Poisson Distribution)

  • 定义:泊松分布描述了一定时间或空间内随机事件的出现次数。如果事件发生的平均率为 λ \lambda λ,则 X ∼ Poisson ( λ ) X \sim \text{Poisson}(\lambda) XPoisson(λ)
  • 概率质量函数 P ( X = k ) = λ k e − λ k ! , k = 0 , 1 , 2 , … P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k = 0, 1, 2, \ldots P(X=k)=k!λkeλ,k=0,1,2,
  • 期望 E ( X ) = λ E(X) = \lambda E(X)=λ
  • 方差 Var ( X ) = λ \text{Var}(X) = \lambda Var(X)=λ
  • 分布函数
    F ( x ) = ∑ k = 0 ⌊ x ⌋ λ k e − λ k ! F(x) = \sum_{k=0}^{\lfloor x \rfloor} \frac{\lambda^k e^{-\lambda}}{k!} F(x)=k=0xk!λkeλ
    其中, ⌊ x ⌋ \lfloor x \rfloor x表示不超过 x x x的最大整数。
  • 性质:泊松分布是描述稀有事件的分布,通常用来建模单位时间或空间中的事件数,例如电话呼叫数、事故发生数等。泊松分布可视为二项分布在试验次数 n → ∞ n \to \infty n且成功概率 p → 0 p \to 0 p0时的极限。

6. 几何分布 (Geometric Distribution)

  • 定义:几何分布描述了在独立重复试验中首次成功所需的试验次数。如果每次试验成功的概率为 p p p,则 X ∼ Geo ( p ) X \sim \text{Geo}(p) XGeo(p)
  • 概率质量函数 P ( X = k ) = ( 1 − p ) k − 1 p , k = 1 , 2 , … P(X = k) = (1 - p)^{k-1} p, \quad k = 1, 2, \ldots P(X=k)=(1p)k1p,k=1,2,
  • 期望 E ( X ) = 1 p E(X) = \frac{1}{p} E(X)=p1
  • 方差 Var ( X ) = 1 − p p 2 \text{Var}(X) = \frac{1 - p}{p^2} Var(X)=p21p
  • 分布函数
    F ( x ) = 1 − ( 1 − p ) ⌊ x ⌋ F(x) = 1 - (1 - p)^{\lfloor x \rfloor} F(x)=1(1p)x
    其中, ⌊ x ⌋ \lfloor x \rfloor x表示不超过 x x x的最大整数。
  • 性质:几何分布是无记忆性的,即 P ( X > s + t ∣ X > s ) = P ( X > t ) P(X > s + t | X > s) = P(X > t) P(X>s+tX>s)=P(X>t),表示首次成功所需的试验次数与过去失败的次数无关。

7. 负二项分布 (Negative Binomial Distribution)

  • 定义:负二项分布描述了在独立重复试验中第 r r r次成功所需的试验次数。如果每次试验成功的概率为 p p p,则 X ∼ NB ( r , p ) X \sim \text{NB}(r, p) XNB(r,p)
  • 概率质量函数 P ( X = k ) = ( k − 1 r − 1 ) p r ( 1 − p ) k − r , k = r , r + 1 , … P(X = k) = \binom{k-1}{r-1} p^r (1 - p)^{k-r}, \quad k = r, r+1, \ldots P(X=k)=(r1k1)pr(1p)kr,k=r,r+1,
  • 期望 E ( X ) = r p E(X) = \frac{r}{p} E(X)=pr
  • 方差 Var ( X ) = r ( 1 − p ) p 2 \text{Var}(X) = \frac{r(1 - p)}{p^2} Var(X)=p2r(1p)
  • 分布函数
    F ( x ) = ∑ k = r ⌊ x ⌋ ( k − 1 r − 1 ) p r ( 1 − p ) k − r F(x) = \sum_{k=r}^{\lfloor x \rfloor} \binom{k-1}{r-1} p^r (1 - p)^{k-r} F(x)=k=rx(r1k1)pr(1p)kr
    其中, ⌊ x ⌋ \lfloor x \rfloor x表示不超过 x x x的最大整数。
  • 性质:负二项分布是几何分布的推广,描述了多次成功所需的试验次数。

8. 超几何分布 (Hypergeometric Distribution)

  • 定义:超几何分布描述了从有限总体中不放回抽样的情况下,成功次数的分布。设总体中有 N N N个元素,其中 K K K个是成功的,抽取 n n n个元素,则 X ∼ Hyper ( N , K , n ) X \sim \text{Hyper}(N, K, n) XHyper(N,K,n)
  • 概率质量函数 P ( X = k ) = ( K k ) ( N − K n − k ) ( N n ) , k = 0 , 1 , … , min ⁡ ( n , K ) P(X = k) = \frac{\binom{K}{k} \binom{N-K}{n-k}}{\binom{N}{n}}, \quad k = 0, 1, \ldots, \min(n, K) P(X=k)=(nN)(kK)(nkNK),k=0,1,,min(n,K)
  • 期望 E ( X ) = n K N E(X) = n \frac{K}{N} E(X)=nNK
  • 方差 Var ( X ) = n K N N − K N N − n N − 1 \text{Var}(X) = n \frac{K}{N} \frac{N-K}{N} \frac{N-n}{N-1} Var(X)=nNKNNKN1Nn
  • 分布函数
    F ( x ) = ∑ k = 0 ⌊ x ⌋ ( K k ) ( N − K n − k ) ( N n ) F(x) = \sum_{k=0}^{\lfloor x \rfloor} \frac{\binom{K}{k} \binom{N-K}{n-k}}{\binom{N}{n}} F(x)=k=0x(nN)(kK)(nkNK)
    其中, ⌊ x ⌋ \lfloor x \rfloor x表示不超过 x x x的最大整数。
  • 性质:超几何分布描述了不放回抽样的情况,与二项分布相比,超几何分布考虑了样本抽取对总体的影响。

期望和方差的推导过程

1. 均匀分布 X ∼ U ( a , b ) X \sim U(a, b) XU(a,b)

期望的推导
E ( X ) = ∫ a b x ⋅ 1 b − a   d x = 1 b − a ⋅ x 2 2 ∣ a b = 1 b − a ⋅ b 2 − a 2 2 = a + b 2 E(X) = \int_a^b x \cdot \frac{1}{b - a} \, dx = \frac{1}{b - a} \cdot \frac{x^2}{2} \Big|_a^b = \frac{1}{b - a} \cdot \frac{b^2 - a^2}{2} = \frac{a + b}{2} E(X)=abxba1dx=ba12x2 ab=ba12b2a2=2a+b

方差的推导
E ( X 2 ) = 1 b − a ⋅ x 3 3 ∣ a b = 1 b − a ⋅ b 3 − a 3 3 E(X^2) = \frac{1}{b - a} \cdot \frac{x^3}{3} \Big|_a^b = \frac{1}{b - a} \cdot \frac{b^3 - a^3}{3} E(X2)=ba13x3 ab=ba13b3a3
Var ( X ) = E ( X 2 ) − [ E ( X ) ] 2 = a 2 + a b + b 2 3 − ( a + b 2 ) 2 = ( b − a ) 2 12 \text{Var}(X) = E(X^2) - [E(X)]^2 = \frac{a^2 + ab + b^2}{3} - \left(\frac{a + b}{2}\right)^2 = \frac{(b - a)^2}{12} Var(X)=E(X2)[E(X)]2=3a2+ab+b2(2a+b)2=12(ba)2

2. 指数分布 X ∼ E ( λ ) X \sim E(\lambda) XE(λ)

期望的推导
E ( X ) = ∫ 0 ∞ x ⋅ λ e − λ x   d x = 1 λ E(X) = \int_0^{\infty} x \cdot \lambda e^{-\lambda x} \, dx = \frac{1}{\lambda} E(X)=0xλeλxdx=λ1

方差的推导
E ( X 2 ) = ∫ 0 ∞ x 2 ⋅ λ e − λ x   d x = 2 λ 2 E(X^2) = \int_0^{\infty} x^2 \cdot \lambda e^{-\lambda x} \, dx = \frac{2}{\lambda^2} E(X2)=0x2λeλxdx=λ22
Var ( X ) = 2 λ 2 − ( 1 λ ) 2 = 1 λ 2 \text{Var}(X) = \frac{2}{\lambda^2} - \left(\frac{1}{\lambda}\right)^2 = \frac{1}{\lambda^2} Var(X)=λ22(λ1)2=λ21

3. 正态分布 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) XN(μ,σ2)

期望的推导
对称性可知,期望为 E ( X ) = μ E(X) = \mu E(X)=μ

方差的推导
由正态分布的性质,方差为 Var ( X ) = σ 2 \text{Var}(X) = \sigma^2 Var(X)=σ2

4. 二项分布 X ∼ B ( n , p ) X \sim B(n, p) XB(n,p)

期望的推导
二项分布可以看作 n n n次独立伯努利试验的总和。每次试验成功的概率为 p p p,因此 E ( X ) = n p E(X) = np E(X)=np

方差的推导
二项分布的方差为 Var ( X ) = n p ( 1 − p ) \text{Var}(X) = np(1 - p) Var(X)=np(1p)

5. 泊松分布 X ∼ Poisson ( λ ) X \sim \text{Poisson}(\lambda) XPoisson(λ)

期望的推导
泊松分布的期望可以通过计算其概率生成函数得出,结果为 E ( X ) = λ E(X) = \lambda E(X)=λ

方差的推导
泊松分布的方差也是 Var ( X ) = λ \text{Var}(X) = \lambda Var(X)=λ

6. 几何分布 X ∼ Geo ( p ) X \sim \text{Geo}(p) XGeo(p)

期望的推导
E ( X ) = ∑ k = 1 ∞ k ( 1 − p ) k − 1 p = 1 p E(X) = \sum_{k=1}^{\infty} k (1 - p)^{k-1} p = \frac{1}{p} E(X)=k=1k(1p)k1p=p1

方差的推导
E ( X 2 ) = ∑ k = 1 ∞ k 2 ( 1 − p ) k − 1 p = 2 − p p 2 E(X^2) = \sum_{k=1}^{\infty} k^2 (1 - p)^{k-1} p = \frac{2 - p}{p^2} E(X2)=k=1k2(1p)k1p=p22p
Var ( X ) = E ( X 2 ) − [ E ( X ) ] 2 = 2 − p p 2 − ( 1 p ) 2 = 1 − p p 2 \text{Var}(X) = E(X^2) - [E(X)]^2 = \frac{2 - p}{p^2} - \left(\frac{1}{p}\right)^2 = \frac{1 - p}{p^2} Var(X)=E(X2)[E(X)]2=p22p(p1)2=p21p

7. 负二项分布 X ∼ NB ( r , p ) X \sim \text{NB}(r, p) XNB(r,p)

期望的推导
E ( X ) = ∑ k = r ∞ k ( k − 1 r − 1 ) p r ( 1 − p ) k − r = r p E(X) = \sum_{k=r}^{\infty} k \binom{k-1}{r-1} p^r (1 - p)^{k-r} = \frac{r}{p} E(X)=k=rk(r1k1)pr(1p)kr=pr

方差的推导
E ( X 2 ) = ∑ k = r ∞ k 2 ( k − 1 r − 1 ) p r ( 1 − p ) k − r = r ( r + 1 ) ( 1 − p ) p 2 E(X^2) = \sum_{k=r}^{\infty} k^2 \binom{k-1}{r-1} p^r (1 - p)^{k-r} = \frac{r(r+1)(1-p)}{p^2} E(X2)=k=rk2(r1k1)pr(1p)kr=p2r(r+1)(1p)
Var ( X ) = E ( X 2 ) − [ E ( X ) ] 2 = r ( r + 1 ) ( 1 − p ) p 2 − ( r p ) 2 = r ( 1 − p ) p 2 \text{Var}(X) = E(X^2) - [E(X)]^2 = \frac{r(r+1)(1-p)}{p^2} - \left(\frac{r}{p}\right)^2 = \frac{r(1 - p)}{p^2} Var(X)=E(X2)[E(X)]2=p2r(r+1)(1p)(pr)2=p2r(1p)

8. 超几何分布 X ∼ Hyper ( N , K , n ) X \sim \text{Hyper}(N, K, n) XHyper(N,K,n)

期望的推导
E ( X ) = n K N E(X) = n \frac{K}{N} E(X)=nNK

方差的推导
Var ( X ) = n K N N − K N N − n N − 1 \text{Var}(X) = n \frac{K}{N} \frac{N-K}{N} \frac{N-n}{N-1} Var(X)=nNKNNKN1Nn

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值