概率分布：二项分布

最新推荐文章于 2025-03-19 16:04:55 发布

带着地球去浪一浪

最新推荐文章于 2025-03-19 16:04:55 发布

阅读量1.5w

点赞数 12

分类专栏：概率论与随机过程文章标签：概率论数据分析

本文链接：https://blog.csdn.net/weixin_42428226/article/details/118667412

版权

概率论与随机过程专栏收录该内容

11 篇文章

订阅专栏

二项分布是描述独立重复伯努利试验中成功次数的概率分布。在每次试验中，事件发生的概率p和不发生的概率(1-p)保持不变，且各次试验独立。当n很大，p很小，二项分布可以近似为泊松分布；若n趋于无穷，p保持有限，根据中心极限定理，二项分布趋向正态分布。这种分布广泛应用于统计学和数据分析中。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

二项分布

二项分布(binomial distribution)就是在重复n次独立的伯努利试验(Bernoulli experiment)中，所期望结果出现次数的概率分布。

伯努利试验的特点：

每次试验中只有两种可能的结果，而且两种结果发生与否互相对立，并且相互独立
每次试验中事件发生的概率是相同的
各次试验的事件相互之间独立

重复n次独立的伯努利试验形成二项分布（高尔顿板）

高尔顿板丨图片来源：维基百科

从最上方的节点往下，是几排交错排列的钉子。从入口扔下的小球撞上一个钉子，就像触网的乒乓球一样，弹向左边和右边的概率相等。最上方只有一种可能。下降之后，左右两边比例变成1:1，继续这个步骤，第n行的比例系数其实就是n次二项式的展开系数，或者表现为杨辉三角的第n行数值。

一般地，如果随机变量 $X$ 服从参数为 $n$ 和 $p$ 的二项分布，记为 $X\sim B(n,p)$ 或 $X\sim b(n,p)$ 。 $n$ 次试验中正好得到 $k$ 次成功的概率由概率质量函数给出

$P\{X=k\} = C_n^kp^k(1-p)^{n-k}$

式中， $k=0,1,\cdots,n$ ， $C_n^k$ 是二项式系数。不同参数下的二项分布概率分布：

如果 $X\sim B(n,p)$ ，那么随机变量 $X$ 的期望为

$E[X] = np$

随机变量 $X$ 的方差为

$D[X] = np(1-p)$

二项分布的近似

当 $p=0.5$ 时，二项分布的概率质量函数是对称的。当 $p\neq 0.5$ 时，二项分布的概率质量函数呈现偏态，且 $p>0.5$ 与 $p<0.5$ 的偏斜方向相反。如果 $n$ 很大，即使 $p\neq 0.5$ ，偏态逐渐降低，最终成正态分布。

二项分布逼近正态分布的过程丨图片来源：维基百科

1. 近似为泊松分布

如果 $np$ 存在有限极限 $\lambda$ ，则该二项分布就趋于参数为 $\lambda$ 的泊松分布

$P\{X=k\} = \frac{(np)^k}{k!}e^{-np}$

实际运用中，如果 $n$ 很大，但 $np$ 比较小（比起 $n$ 来说很小），通常 $np\leq 5$ 就满足要求。一般来说，n的值越大，p的值越小，近似就越准确。因为在这种情况下，(1-p)将接近1，因此 $\mbox{Var}(X)$ $=np(1-p)$ 将接近分布的均值，即 $\mbox{E}(X)=np$ 。这满足了泊松分布模型中均值和方差接近的条件。那么用泊松分布近似二项分布更简单些，毕竟泊松分布跟二项分布一样都是离散型分布。