二项分布(Binomial Distribution)

二项分布的基本描述:

   在概率论和统计学里面,带有参数n和p的二项分布表示的是n次独立试验的成功次数的概率分布。在每次独立试验中只有取两个值,表示成功的值的概率为p,那么表示试验不成功的概率为1-p。这样一种判断成功和失败的二值试验又叫做伯努利试验。特殊地,当n=1的时候,我们把二项分布称为伯努利分布。

   二项分布频繁地用于对以下描述的一种实验进行建模:从总数量大小为N的两个事物中进行n次放回抽样,以某一事物为基准,计算成功抽取这个事物的次数的概率。要注意的是必须进行的是放回抽样,对于不放回抽样我们一般用超几何分布来对这样的实验进行建模。


二项分布的概率质量函数:

   一般来说,如果一个随机变量X满足二项分布的话,那么它一定有一个参数n∈ ℕ且还有一个参数p∈ [0,1]。这样的话,我们可以把关于X的二项分布写成X ~ B(np)。对应的概率质量函数如下。

{\displaystyle Pr(k;n,p)=\Pr(X=k)={n \choose k}p^{k}(1-p)^{n-k}}

   这里k = 0, 1, 2, ......, n,并且原括号是组合的表示形式,组合的计算公式如下。

{\binom {n}{k}}={\frac {n!}{k!(n-k)!}}

   这个公式表示的从n个数中取k个数构成一个组合能有多少种不同的取法。整个二项分布我们可以描述为求n次独立的伯努利试验,成功k次的概率是多少。由于一次成功的概率是已知的,因此我们必须求出n次试验中,成功k次可能发生在哪次试验中,一共有多少种可能都要求出来,因此求的就是n取k组合数目。


二项分布的均值:

   如果存在X~B(n, p)这样一个二项分布,也就是说X是呈现出二项分布的随机变量,n表示试验的总数,p表示每个试验中得到成功结果的概率,那么X的期望值如下。

{\displaystyle \operatorname {E} [X]=np.}

   证明在最下面的维基百科链接中。


二项分布的方差:

   同样的,如果存在X~B(n, p)这样一个二项分布,也就是说X是呈现出二项分布的随机变量,n表示试验的总数,p表示每个试验中得到成功结果的概率,那么X的方差如下。

{\displaystyle \operatorname {Var} (X)=np(1-p).}

   证明在最下面的维基百科的链接中。


二项分布的和:

   如果存在两个独立的二项分布X~(n, p)和Y~B(m, p),要注意的是它们在一次试验中成功的结果具有相同的概率p,那么X+Y也是一个二项分布。这样一个和的分布可以表示为Z=X+Y ~ B(n+m, p):

{\begin{aligned}\operatorname {P} (Z=k)&=\sum _{i=0}^{k}\left[{\binom {n}{i}}p^{i}(1-p)^{n-i}\right]\left[{\binom {m}{k-i}}p^{k-i}(1-p)^{m-k+i}\right]\\&={\binom {n+m}{k}}p^{k}(1-p)^{n+m-k}\end{aligned}}

   但是,如果X和Y一次试验成功的结果没有相同的概率p,那么X+Y的和的方差就会比B(n+m, p的均值)这样一个二项分布的方差要小。


使用二项分布近似其它的分布:

   ①近似正态分布:当n足够大,且二项分布的近似曲线不是很弯曲的时候,我们可以用以下式子使二项分布B(n, p)近似于正态分布。并且我们可以用适当的连续性校正(continuity correction)来改善这样一个近似的正态分布。

{\displaystyle {\mathcal {N}}(np,\,np(1-p)),}

   ②近似泊松分布:在np固定不变,n趋于无穷大,p趋于0的时候,我们可以用一个二项分布来近似一个泊松分布。这样的话,泊松分布的λ=np。


二项分布的属性图:

二项分布概率图二项分布的属性


参考资料:

二项分布-维基百科  https://en.wikipedia.org/wiki/Binomial_distribution

二项分布和几何分布是概率论中两种常见的离散随机变量的分布,它们在实际应用中有各自的特性和用途。 **1. 二项分布Binomial Distribution)**: - 它描述的是在一系列独立的伯努利试验中,成功事件发生的次数的随机变量。比如,抛硬币n次,正面朝上k次的概率就符合二项分布。 - 参数有两个:试验次数n(固定)和每次试验成功的概率p(也可能是未知的),记作X~B(n, p)。 - 总体结果可以总结为:P(X=k) = C(n, k) * p^k * (1-p)^(n-k),其中C(n, k)是组合数,表示从n次中取k次的方法数。 **2. 几何分布(Geometric Distribution)**: - 几何分布更关注单次试验成功的累积概率,即直到第一次成功的次数,比如抛硬币直到出现正面。 - 这里的随机变量Y表示第一次成功的试验次数,而试验总是独立且有相同的失败概率p。 - 参数只有一个:每次试验成功的概率p(不考虑试验次数)。 - 几何分布的概率质量函数是:P(Y=k) = p * (1-p)^(k-1),对于k=1,2,3,... **区别**: - **试验次数**:二项分布涉及固定次数的试验,而几何分布关注的是首次成功的次数,次数可变。 - **成功定义**:二项分布是固定数量的成功事件,如硬币正面次数;几何分布关注的是首次成功事件发生前的尝试次数。 - **概率计算**:二项分布在每个可能的结果上都有一个独立的概率;几何分布则是在每次试验的失败累积后获得成功概率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值