Distribution of Discrete Random Variables

最新推荐文章于 2024-04-22 15:55:35 发布

INNER PEACE M

最新推荐文章于 2024-04-22 15:55:35 发布

阅读量305

点赞数 2

分类专栏：数学基础学习

本文链接：https://blog.csdn.net/maggieJJ/article/details/87649917

版权

数学基础学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

离散型随机变量分布：伯努利分布；二项分布；泊松分布；多项分布。

0、基本概念

概率质量函数 pmf Probability mass function
概率质量函数是离散随机变量在各特定取值上的概率。图片如下：

横坐标是离散型随机变量的取值，纵坐标是每个取值的概率(纵坐标一定是非负的，并且和是1)

对于连续性随机变量，使用的是概率密度函数(PDF)

累积分布函数 CDF Cumulative distribution function
累积分布函数能完整描述一个实随机变量X的累积概率分布，同样适用于离散型和连续型随机变量。

上图是正态分布的累积分布函数。

对于连续性随机变量，亦是如此

1、伯努利分布 Bernoulli distribution

伯努利分布又称"零一分布"，“两点分布”。伯努利分布只做一次实验，只有两种结果，1:成功；0:失败；则伯努利分布为：

$\begin{cases} p , & X=1 \\ 1-p, & X=0 \end{cases}$

此时称随机变量X服从参数为 $p$ 的伯努利分布，那么
期望值：
$E (X) = 1 * p + 0 * (1 - p) = p$
$E(X^2)=1^2*p + 0^2 *(1-p) = p$
方差：
$Var(X)=E(X^2)-[E(X)]^2=p^2-p=p(1-p)$

2、二项分布 Binomial distribution

二项分布就是重复n次独立的伯努利试验。在每次试验中只有两种可能的结果，而且两种结果发生与否互相对立，并且相互独立，与其它各次试验结果无关，事件发生与否的概率在每一次独立试验中都保持不变。

二项分布的参数是n和p，其中n是试验的总数，p是每次试验成功的概率。n次独立重复事件发生k次的概率为：
$B(n,p)=C_n^k\ p^k(1-p)^{n-k}=\frac{n!}{(n-k)!k!} \ p^k(1-p)^{n-k}$

如果随机变量 $X$ 服从二项分布，即： $\sim B(n, p)$ ，那么他的期望值和方差分别是：

期望值：
$E (X) = n p$
方差：
$V a r (X) = n p (1 - p)$

计算证明公式详见wiki

下图左图二项分布的概率质量函数pmf，右图是累积分布函数CDF
在这里插入图片描述

关系一：伯努利分布和二项分布的关系

相同点：二项分布和伯努利分布的每次试验都只有两个可能的结果
二项分布 $B (n, p)$ 中 $n = 1$ 的时候，就是伯努利分布

3、泊松分布 Poisson distribution

大量事件的发生是有固定频率的，泊松分布描述某段时间内，随机事件的发生频率。泊松分布的概率分布函数公式如下：
$P(k\ event\ in\ interval)=P\Big(N\left(t\right)=k\Big)=e^{-\lambda} \frac{\lambda^k}{k!} \quad k=1,2...$

等号左边 $P$ 表示概率， $N$ 表示某种函数关系， $t$ 表示时间， $k$ 表示数量，λ是单位时间(或单位面积)内随机事件的平均发生次数。泊松分布适合于描述单位时间内随机事件发生的次数。

举例说明：要计算1小时内出生3个婴儿的概率，等号左边为 $P\Big(N(1)=3\Big)$ ，等号的右边λ表示事件的频率（如平均每小时出生5个婴儿）。

泊松分布的期望值：
$E(X)=\lambda$
方差：
$Var(X)=\lambda$

下图左右分别为泊松分布的概率质量函数pmf、累积分布函数CDF（λ表示事件的频率）
在这里插入图片描述
泊松分布的主要特点：

泊松分布的主要特点：

1、泊松分布是个计数过程,通常用于模拟一个非连续事件在连续时间中的发生次数

2、任何一个成功事件不能影响其它的成功事件（N(t+s)-N(t)增量之间互相独立）

3、经过短时间间隔的成功概率必须等于经过长时间间隔的成功概率

4、时间间隔趋向于无穷小的时候，一个时间间隔内的成功概率趋近零

参考原文：https://blog.csdn.net/qq_38984677/article/details/81110450

关系二：泊松分布和二项分布的关系：
当二项分布满足以下三个条件时候，泊松分布就是二项分布的极限形式：
(1). n→∞；(2). p→0；(3). np=λ
证明如下：
$\begin{aligned} \lim \limits_{n\rightarrow\infty, p\rightarrow0} C_n ^ {k}p ^ k(1-p)^{n-k} & = \lim \limits_{n\rightarrow\infty, p\rightarrow0} \frac{n(n-1)\cdots(n-1+k)}{k!}p^k(1-p)^{n-k} \\ & = \lim \limits_{n\rightarrow\infty, p\rightarrow0} \frac{n^k}{k!}p ^{k}(1-p) ^{\frac{\lambda}{p}-k} \\ & = \lim \limits_{n\rightarrow\infty, p\rightarrow0} \frac{\lambda^k}{k!}[(1-p) ^{\frac{1}{-p}}] ^{-\lambda}\frac{1}{(1-p) ^{k}} \\ & = \lim \limits_{n\rightarrow\infty, p\rightarrow0} \frac{\lambda^k}{k!}e ^{-\lambda} \end{aligned}$

4、多项式分布 Multinomial distribution

多项式分布是二项式分布的推广，二项式的典型例子是扔硬币，多项式是扔骰子，骰子有6个面对应6个不同的点数，这样单次每个点数朝上的概率都是1/6（对应 $p_1~p_6$ ，它们的值不一定都是1/6，只要和为1且互斥即可，比如一个形状不规则的骰子），重复扔n次。

如果问有x次都是点数6朝上的概率就是： $C_n^xp_6^x(1-p_6)^{n-x}$ ；

更一般性的会问：点数1～6的出现次数分别为 $x_1,x_2,x_3,x_4,x_5,x_6)$ 时的概率是多少？其中 $sum(x_1\sim x_6)= n$ 。这就是一个多项式分布问题。那么他的质量分布函数是：
在这里插入图片描述
这个公式是如何得来的，可以参考这篇文章：
https://blog.csdn.net/apache_xiaochao/article/details/30535521

其实如果另 $k = 2$ ，那么就是二项分布的公式，这样很容易，推广到多项是这个公式也就不难理解了。

$x_i$ 为第 $i$ 种状态输出结果的频度，根据多项分布的极大似然估计得:
$\hat{p_i}=\frac{x_i}{n}$

多项分布的期望值：
$E\{X_i\}=np_i$
方差：
$Var\{X_i\}=np_i(1-p_i)$

INNER PEACE M

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Distribution of Discrete Random Variables

离散型随机变量分布：伯努利分布；二项分布；泊松分布；多项分布。1、伯努利分布(Binomial distribution)伯努利分布又称&amp;amp;amp;amp;quot;零一分布&amp;amp;amp;amp;quot;，“两点分布”。伯努利分布只做一次实验，只有两种结果，1:成功；0:失败；则伯努利分布为：P(X)={p,X=11−p,X=0P(X)= \begin{cases}p , &amp;amp;amp;amp;amp;amp;amp; X=1
复制链接

扫一扫

专栏目录