概率分布:二项分布

二项分布是描述独立重复伯努利试验中成功次数的概率分布。在每次试验中,事件发生的概率p和不发生的概率(1-p)保持不变,且各次试验独立。当n很大,p很小,二项分布可以近似为泊松分布;若n趋于无穷,p保持有限,根据中心极限定理,二项分布趋向正态分布。这种分布广泛应用于统计学和数据分析中。
摘要由CSDN通过智能技术生成

二项分布

二项分布(binomial distribution)就是在重复n次独立的伯努利试验(Bernoulli experiment)中,所期望结果出现次数的概率分布。

伯努利试验的特点:

  1. 每次试验中只有两种可能的结果,而且两种结果发生与否互相对立,并且相互独立
  2. 每次试验中事件发生的概率是相同的
  3. 各次试验的事件相互之间独立

重复n次独立的伯努利试验形成二项分布(高尔顿板)

高尔顿板丨图片来源:维基百科

从最上方的节点往下,是几排交错排列的钉子。从入口扔下的小球撞上一个钉子,就像触网的乒乓球一样,弹向左边和右边的概率相等。最上方只有一种可能。下降之后,左右两边比例变成1:1,继续这个步骤,第n行的比例系数其实就是n次二项式的展开系数,或者表现为杨辉三角的第n行数值。

一般地,如果随机变量X服从参数为np的二项分布,记为X\sim B(n,p)X\sim b(n,p)n次试验中正好得到k次成功的概率由概率质量函数给出

P\{X=k\} = C_n^kp^k(1-p)^{n-k}

式中,k=0,1,\cdots,nC_n^k是二项式系数。不同参数下的二项分布概率分布:

如果X\sim B(n,p),那么随机变量X的期望为

E[X] = np

随机变量X的方差为

D[X] = np(1-p)

二项分布的近似

p=0.5时,二项分布的概率质量函数是对称的。当p\neq 0.5时,二项分布的概率质量函数呈现偏态,且p>0.5p<0.5的偏斜方向相反。如果n很大,即使p\neq 0.5,偏态逐渐降低,最终成正态分布。

 二项分布逼近正态分布的过程丨图片来源:维基百科

1. 近似为泊松分布

如果np存在有限极限\lambda,则该二项分布就趋于参数为\lambda的泊松分布

P\{X=k\} = \frac{(np)^k}{k!}e^{-np}

实际运用中,如果n很大,但np比较小(比起n来说很小),通常np\leq 5就满足要求。一般来说,n的值越大,p的值越小,近似就越准确。因为在这种情况下,(1-p)将接近1,因此\mbox{Var}(X)=np(1-p)将接近分布的均值,即\mbox{E}(X)=np。这满足了泊松分布模型中均值和方差接近的条件。那么用泊松分布近似二项分布更简单些,毕竟泊松分布跟二项分布一样都是离散型分布。

2. 近似为高斯分布

如果np趋于无限大(如p是一个定值),则根据德莫佛-拉普拉斯(De'Moivre-Laplace)中心极限定理,这列二项分布将趋近于高斯分布(正态分布)

f(x)=\frac{1}{\sqrt{2\pi}\sigma}\exp\{-\frac{1}{2\sigma^2}(x-\mu)^2\}

式中,\mu = np\sigma = \sqrt{np(1-p)}

实际运用中,要求np\geq 5n(1-p)\geq 5时,一般都用高斯分布来近似计算二项分布。

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

带着地球去浪一浪

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值