本文是一篇手记,记录了我对负二项分布及其应用的理解。目录如下:
1.理解"负"的含义
知乎回答有提到: https://www. zhihu.com/question/2425 3978?sort=created
文档中有提到: http://www. johndcook.com/negativeb inomial.pdf
负二项级数: https:// brilliant.org/wiki/nega tive-binomial-theorem/
负是指负二项级数,但实际上,“负”除了告诉我们负二项分布的由来,对理解其直观意义并无帮助。
根据组合数定义:
把组合数定义带入下面的式子((1-q)^-r是负二项级数):
2.理解定义1:伯努利过程视角
https://www. johndcook.com/blog/comp uting_binomial_coefficients/
定义1完全是基于负二项级数得到的,从伯努利过程的视角出发,也能自然的能理解负二项分布;
实际上,负二项分布描述的是第r次成功前失败的次数,记为k,那么有:
2.1.理解其作为sum of i.i.d geom
一旦理解了定义1,很自然的就可以理解为什么sum of i.i.d geom 是 负二项分布:
因为几何分布刻画的是在多次伯努利试验中,第一次成功前所经历的失败次数。
2.2.理解其期望/方差/MGF的推导 done
推导链接参考: https:// statisticalmodeling.wordpress.com /2011/07/28/the-negative-binomial-distribution/
理解了sum of i.i.d geom 是 NB后,NB的很多数字特征是可以通过geom推导出来的。
包括:
期望/方差/MGF
假设由r个i.i.d的几何分布相加,得到了NB(r,p),那么期望与方差可以写作:
MGF:
只需要从几何分布的期望/方差/MGF出发就能得到上面的结果。
2.3.理解定义1的拓展
由于gamma函数在整数时恰好等于整数-1的阶乘,即:
因此,可以把组合数的定义式利用gamma函数对定义1进行拓展,这样使得r得取值范围在整个正实数范围。即:
# failures before r-th succe