【推导过程】常用离散分布的数学期望、方差、特征函数

小猪快跑爱摄影

已于 2024-12-09 22:23:54 修改

阅读量1.7k

点赞数 22

分类专栏：概率论文章标签：概率论

于 2024-10-16 23:01:59 首次发布

本文链接：https://blog.csdn.net/ymzhu385/article/details/142993742

版权

概率论专栏收录该内容

11 篇文章

订阅专栏

文章目录

相关教程
相关文献
常用离散分布的数学期望&方差&特征函数
二项分布
- 数学期望
- 方差
泊松分布
超几何分布
几何分布
负二项分布

作者：小猪快跑

基础数学&计算数学，从事优化领域7年+，主要研究方向：MIP求解器、整数规划、随机规划、智能优化算法

常用离散分布（二项分布、泊松分布、超几何分布、几何分布与负二项分布）的数学期望、方差、特征函数具体推导。

如有错误，欢迎指正。如有更好的算法，也欢迎交流！！！——@小猪快跑

常用离散分布的数学期望&方差&特征函数

分布名称	概率分布或密度函数 $p (x)$	数学期望	方差	特征函数
单点分布	$\begin{array}{c}{p_{c}=1}\end{array}$ ( $c$ 为常数)	$c$	$0$	$e^{ict}$
$0 - 1$ 分布	$\begin{array}{c} p_{0}=1-p,p_{1}=p\\ (0<p<1)\end{array}$	$p$	$p (1 - p)$	$1-p+pe^{it}$
二项分布 $b (n, p)$	$p_{k}=\binom{n}{k}p^{k}(1-p)^{n-k}\\k=0,1,2,\cdots,n\\(0<p<1)$	$n p$	$n p (1 - p)$	$1-p+pe^{it})^{n}$
泊松分布 $P(\lambda)$	$p_{k}=\frac{\lambda^{k}}{k!}e^{-k}\\k=0,1,2,\cdots;(\lambda>0)$	$\lambda$	$\lambda$	$e^{\lambda(e^{it}-1)}$
超几何分布 $h (n, N, M)$	$p_{k}=\frac{\displaystyle\binom{M}{k}\binom{N-M}{n-k}}{\displaystyle\binom{N}{n}}\\M\leqslant N,n\leqslant N,M,N,n\text{ 正整数,}\\k=0,1,2,\cdots,\min(M,N)$	$n\displaystyle\frac MN$	$\displaystyle\frac{nM}N(1-\frac MN)\frac{N-n}{N-1}$	$\displaystyle\sum_{k=0}^n\frac{\displaystyle\binom Mk\binom{N-M}{n-k}}{\displaystyle\binom Nn}e^{itk}$
几何分布 $G e (p)$	$p_{k}=(1-p)^{k-1}p\\k=1,2,\cdots\\(0<p<1)$	$\displaystyle\frac1p$	$\displaystyle\frac{1-p}{p^2}$	$\displaystyle\frac{pe^{it}}{1-(1-p)e^{it}}$
负二项分布帕斯卡分布 $N b (r, p)$	$\begin{gathered}p_{k}={\binom{k-1}{r-1}}(1-p)^{k-r}p^{r} \\r正整数,k=r,r+1,\cdots \\(0<p<1) \end{gathered}$	$\displaystyle\frac rp$	$\displaystyle\frac{r(1-p)}{p^2}$	$\left(\displaystyle\frac{pe^{it}}{1-(1-p)e^{it}}\right)^r$

二项分布

请添加图片描述

如果记 $X$ 为 $n$ 重伯努利试验中成功（记为事件 $A$ ）的次数，则 $X$ 的可能取值为 $0,1,\cdots,n$ 。记 $p$ 为每次试验中 $A$ 发生的概率，即 $P (A) = p$ ，则 $P(\bar A)=1-p$ 。

因为 $n$ 重伯努利试验的基本结果可以记作
$\omega = (\omega_1, \omega_2, \cdots , \omega_n)$
其中 $\omega_i$ 或者为 $A$ ，或者为 $\bar A$ 。这样的 $\omega$ 共有 $2^n$ 个，这 $2^n$ 个样本点 $\omega$ 组成了样本空间 $\Omega$ 。

下面求 $X$ 的分布列，即求事件 ${X=k\}$ 的概率。若某个样本点
$\omega = (\omega_1,\omega_2,\cdots,\omega_n) \in \{ X = k \}$
意味着 $\omega_1,\omega_2,\cdots,\omega_n$ 中有 $k$ 个 $A, n - k$ 个 $\bar A$ ，所以由独立性知
$P(\omega) = p^k(1-p)^{n-k}$
而事件 ${X=k\}$ 中这样的 $\omega$ 共有 $\binom nk$ 个，所以 $X$ 的分布列为

$P(X=k)=\binom{n}{k}p^k(1-p)^{n-k}, k=0,1,\cdots,n$

数学期望

$\begin{aligned} E(X)& =\sum_{k=0}^nk\binom nkp^k(1-p)^{n-k} \\ &=np\sum_{k=1}^n\binom{n-1}{k-1}p^{k-1}(1-p)^{(n-1)-(k-1)} \\ &=np[p+(1-p)]^{n-1}=np \end{aligned}$

方差

$\begin{align*} E(X^2) & = \sum_{k=0}^nk^2\binom nkp^k(1-p)^{n-k} \\ & = \sum_{k=1}^n(k-1+1)k\binom nkp^k(1-p)^{n-k} \\ & = \sum_{k=1}^nk(k-1)\binom nkp^k(1-p)^{n-k} + \sum_{k=1}^nk\binom nkp^k(1-p)^{n-k} \\ & = \sum_{k=2}^nk(k-1)\binom nkp^k(1-p)^{n-k} + np \\ & = n(n-1)p^2\sum_{k=2}^n\binom{n-2}{k-2} p^{k-2} (1-p)^{(n-2)-(k-2)} + np \\ & = n(n-1)p^2 + np. \end{align*}$

$\mathrm{Var}(X) = E(X^2) - [E(X)]^2 = n(n-1)p^2 + np - (np)^2 = np(1-p)$

泊松分布

请添加图片描述

在单位时间内，电话总机接到用户呼唤的次数
在单位时间内，一电路受到外界电磁波的冲击次数
1平方米内，玻璃上的气泡数
一铸件上的砂眼数
在单位时间内，某种放射性物质分裂到某区域的质点数等等

设随机变量 $X\sim P(\lambda)$
$P(X=k)=\frac{\lambda^k}{k!}\mathrm{e}^{-\lambda}, k=0, 1,2,\cdots,$

泊松定理

在 $n$ 重伯努利试验中，记事件 $A$ 在一次试验中发生的概率为 $p_n$ （与试验次数 $n$ 有关），如果当 $n\to+\infty$ 时，有 $np_n\to\lambda$ ，则
$\lim_{n\to+\infty} \binom nk p_n^k(1-p_n)^{n-k} = \frac{\lambda^k}{k!}\mathrm{e}^{-\lambda}.$
记 $np_n=\lambda_n$ ，记 $p_n=\lambda_n/n$ ，我们可得
$\begin{align*} \binom nk p_n^k(1-p_n)^{n-k} & = \frac{n(n-1)\cdots(n-k+1)}{k!}\left( \frac{\lambda_n}n \right)^k \left( 1 - \frac{\lambda_n}n \right)^{n-k} \\ & = \frac{\lambda_n^k}{k!}\left( 1 - \frac1n \right)\left( 1 - \frac2n \right) \cdots \left( 1 - \frac{k-1}n \right) \left( 1 - \frac{\lambda_n}n \right)^{n-k}. \end{align*}$
对固定的 $k$ 有
$\begin{align*} & \lim_{n\to+\infty}\lambda_n = \lambda \\ & \lim_{n\to+\infty}\left( 1 - \frac{\lambda_n}n \right)^{n-k} = \mathrm{e}^{-\lambda} \\ & \lim_{n\to+\infty}\left( 1 - \frac1n \right) \cdots \left( 1 - \frac{k-1}n \right) = 1 \end{align*}$
从而
$\lim_{n\to+\infty} \binom nk p_n^k(1-p_n)^{n-k} = \frac{\lambda^k}{k!}\mathrm{e}^{-\lambda}$
对任意的 $k$ （ $k=0,1,2,\cdots$ ）成立。

数学期望

$\sum_{k=0}^{+\infty} k\frac{\lambda^k}{k!}\mathrm{e}^{-\lambda} = \lambda\mathrm{e}^{-\lambda} \sum_{k=1}^{+\infty}\frac{\lambda^{k-1}}{(k-1)!} = \lambda\mathrm{e}^{-\lambda} \mathrm{e}^\lambda = \lambda$

方差

$\begin{aligned} E(X^{2})& =\sum_{k=0}^{+\infty}k^{2}\frac{\lambda^{k}}{k!}\mathrm{e}^{-\lambda}=\sum_{k=1}^{+\infty}k \frac{\lambda^{k}}{(k-1)!}\mathrm{e}^{-\lambda} \\ &=\sum_{k=1}^{+\infty}[(k-1)+1]\frac{\lambda^k}{(k-1)!}\mathrm{e}^{-\lambda} \\ &=\lambda^{2}\mathrm{e}^{-\lambda}\sum_{k=2}^{+\infty}\frac{\lambda^{k-2}}{(k-2)!}+\lambda\mathrm{e}^{-\lambda}\sum_{k=1}^{+\infty}\frac{\lambda^{k-1}}{(k-1)!} \\ &=\lambda^{2}+\lambda. \end{aligned}$

$\mathrm{Var}(X)=E(X^2)-[E(X)]^2=\lambda^2+\lambda-\lambda^2=\lambda$

超几何分布

请添加图片描述

从一个有限总体中进行不放回抽样常会遇到超几何分布。

设有 $N$ 个产品，其中有 $M$ 个不合格品。若从中不放回地随机抽取 $n$ 个，则其中含有的不合格品的个数 $X$ 服从超几何分布，记为 $X\sim h(n,N,M)$ 。超几何分布的概率分布列为
$\frac{\binom Mk \binom{N-M}{n-k}} {\binom Nn},\; k = 0,1,\cdots,r$

其中 $r=\min\{M,n\}$ ，且 $M\le N,n\le N,n,N,M$ 均为正整数。

超几何分布的二项近似

当 $n\ll N$ 时，即抽取个数 $n$ 远小于产品总数 $N$ 时，每次抽取后，总体中的不合格品率 $p = M / N$ 改变甚徽，所以不放回抽样可近似地看成放回抽样，这时超几何分布可用二项分布近似：
$\frac{\binom Mk \binom{N-M}{n-k}} {\binom Nn} \cong \binom nkp^k(1-p)^{n-k},\;\text{其中}\,p = \frac MN$

数学期望

若 $X\sim h(n,N,M)$ ，则 $X$ 的数学期望为
$\sum_{k=0}^rk\frac{\binom Mk \binom{N-M}{n-k}} {\binom Nn} = n\frac MN \sum_{k=1}^r \frac{\binom {M-1}{k-1} \binom{N-M}{n-k}} {\binom {N-1}{n-1}} = n\frac MN$

方差

$\begin{align*} E(X^2) & = \sum_{k=1}^rk^2\frac{\binom Mk \binom{N-M}{n-k}} {\binom Nn} = \sum_{k=2}^r k(k-1) \frac{\binom Mk \binom{N-M}{n-k}} {\binom Nn} + n \frac MN \\ & = \frac{M(M-1)}{\binom Nn} \sum_{k=2}^rk(k-1) \binom{M-2}{k-2} \binom{N-M}{n-k} + n\frac MN \\ & = \frac{M(M-1)}{\binom Nn} \binom{N-2}{n-2} + n \frac MN = \frac{M(M-1)n(n-1)}{N(N-1)} + n \frac MN, \end{align*}$

由此得 $X$ 的方差为
$\mathrm{Var}(X) = E(X^2) - [E(X)]^2 = \frac{nM(N-M)(N-n)}{N^2(N-1)}$

几何分布

请添加图片描述

在伯努利试验序列中，记每次试验中事件 $A$ 发生的概率为 $p$ ，如果 $X$ 为事件 $A$ 首次出现时的试验次数，则 $X$ 的可能取值为 $1,2,\cdots$ ，称 $X$ 服从几何分布，记为 $X\sim Ge(p)$ ，其分布列为
$p)^{k-1}p,\; k = 1,2,\cdots$
实际中有不少随机变量服从几何分布，譬如，

某产品的不合格率为0.05，则首次查到不合格品的检查次数 $X\sim Ge(0.05)$
某射手的命中率为0.8，则首次击中目标的射击次数 $Y\sim Ge(0.8)$
掷一颗骰子，首次出现6点的投掷次数 $Z\sim Ge(1/6)$
同时掷两颗骰子，首次达到两个点数之和为8的投掷次数 $W\sim Ge(5/36)$

几何分布的无记忆性

设 $X\sim Ge(p)$ ，则对任意正整数 $m$ 与 $n$ 有
$P (X > m + n ∣ X > m) = P (X > n)$
在证明之前先解释上述概率等式的含义.在一列伯努利试验序列中，若首次成功 $(A)$ 出现的试验次数X服从几何分布，则事件“ $X > m$ ”表示前 $m$ 次试验中 $A$ 没有出现.假如在接下去的 $n$ 次试验中 $A$ 仍未出现，这个事件记为“ $X > m + n$ ”.这个定理表明：在前 $m$ 次试验中 $A$ 没有出现的条件下，则在接下去的 $n$ 次试验中 $A$ 仍未出现的概率只与 $n$ 有关，而与以前的 $m$ 次试验无关，似乎忘记了前 $m$ 次试验结果，这就是无记忆性。

因为
$\sum_{k=n+1}^{+\infty}(1-p)^{k-1}p = \frac{p(1-p)^n}{1-(1-p)} = (1-p)^n$
所以对任意的正整数 $m$ 与 $n$ ，条件概率
$\begin{align*} P(X > m + n | X > m) & = \frac{P(X>m+n)}{P(X>m)} = \frac{(1-p)^{m+n}}{(1-p)^m} \\ & = (1 - p)^n = P(X > n) \end{align*}$

数学期望

设随机变量 $X$ 服从几何分布 $G e (p)$ ，令 $q = 1 - p$ ，利用逐项微分可得 $X$ 的数学期望为
$\begin{align*} E(X) & = \sum_{k=1}^{+\infty} kpq^{k-1} = p\sum_{k=1}^{+\infty}kq^{k-1} = p\sum_{k=1}^{+\infty}\frac{\mathrm dq^k}{\mathrm dq} \\ & = p\frac{\mathrm d}{\mathrm dq}\Big( \sum_{k=0}^{+\infty}q^k \Big) = p \frac{\mathrm d}{\mathrm dq}\left( \frac1{1-q} \right) = \frac p{(1-q)^2} = \frac1p \end{align*}$

方差

$\begin{align*} E(X^2) & = \sum_{k=1}^{+\infty} k^2pq^{k-1} = p \bigg[ \sum_{k=1}^{+\infty} k(k-1)q^{k-1} + \sum_{k=1}^{+\infty} kq^{k-1} \bigg] \\ & = pq\sum_{k=1}^{+\infty} k(k-1)q^{k-2} + \frac1p = pq \sum_{k=1}^{+\infty}\frac{\mathrm d^2}{\mathrm dq^2}q^k + \frac1p \\ & = pq\frac{\mathrm d^2}{\mathrm dq^2}\Big(\sum_{k=1}^{+\infty}q^k\big) + \frac1p = pq \frac{\mathrm d^2}{\mathrm dq^2}\left( \frac1{1-q}\right) + \frac1p \\ & = pq\frac2{(1-q)^3} + \frac1p = \frac{2q}{p^2} + \frac1p \end{align*}$

由此得 $X$ 的方差为
$\mathrm{Var}(X) = E(X^2) - [E(X)]^2 = \frac{2q}{p^2} + \frac1p - \frac1{p^2} = \frac{1-p}{p^2}$

负二项分布

请添加图片描述

作为几何分布的一种延伸，我们注意下面的负二项分布，巴斯卡分布：

在伯努利试验序列中，记每次试验中事件 $A$ 发生的概率为 $p$ ，如果 $X$ 为事件 $A$ 第 $r$ 次出现时的试验次数，则 $X$ 的可能取值为 $r,r+1,\cdots,r+m,\cdots$ . 称 $X$ 服从负二项分布或巴斯卡分布，其分布列为
$\binom{k-1}{r-1} p^r(1-p)^{k-r},\; k=r,r+1,\cdots$
记为 $X\sim Nb(r,p)$ 。当 $r = 1$ 时，即为几何分布。

这是因为在次伯努利试验中，最后一次一定是 $A$ ，而前 $k - 1$ 次中 $A$ 应出现 $r - 1$ 次，由二项分布知其概率为 $\binom{k-1}{r-1}p^{r-1}(1-p)^{k-r}$ ，再乘以最后一次出现 $A$ 的概率 $p$ ，即得。

可以算得负二项分布的数学期望为 $r / p$ ，方差为 $r(1-p)/p^2$ 。从直观上看这是合理的，因为首次出现 $A$ 的平均试验次数是 $1/ p$ ，那么第 $r$ 个 $A$ 出现所需的平均试验次数是 $r / p$ 。

如果将第一个 $A$ 出现的试验次数记为 $X_1$ ，第二个 $A$ 出现的试验次数（从第一个 $A$ 出现之后算起）记为 $X_2$ ，第 $r$ 个 $A$ 出现的试验次数（从第 $r - 1$ 个 $A$ 出现之后算起）记为 $X_r$ ，则 $X_i$ 独立同分布，且 $X_i\sim Ge(p)$ .此时有 $X=X_1+X_2+\cdots+X_r\sim Nb(r,p)$ ，即负二项分布的随机变量可以表示成 $r$ 个独立同分布的几何分布随机变量之和。