超几何分布描述了从有限个对象中不放回抽样的情况。比如有一个装有白球和黑球的罐子,超几何分布可以用来计算抽出特定数量白球的概率。
如果你有一个装有 w 个白球和 b 个黑球的罐子,不放回地随机抽取 n 个球,那么抽出的白球数量就服从超几何分布,记为 。超几何分布的概率质量函数(PMF)如下所示:
对于满足条件 且 的整数 k 。
这与二项分布不同,二项分布描述了进行 n 次独立伯努利试验(每次试验成功的概率都是 p )得到的成功次数的分布。然而,二项分布中的每次试验都是独立的,每次抽取都是放回的,而超几何分布的抽样是不放回的,即前一次抽取的结果会影响后续的抽取。
举个例子,如果我们抓捕了 \( N \) 只麋鹿,标记了 \( m \) 只然后放归自然。之后我们再捕捉 \( n \) 只麋鹿,标记的麋鹿数量就是超几何分布的一个实例。另一个例子是扑克牌手中的王牌数量。
最后,超几何分布中 和 实际上是相同的分布,这是由于抽取白球的过程与抽取球总数减去黑球数量的过程是对称的。这也显示了超几何分布的一个有趣属性,即它具有某种对称性。这样的对称性是超几何分布的特点之一,有助于在计算中简化问题。