负二项分布

负二项分布与二项分布不一样,它表示在一些列伯努利试验中,成功概率为 p p p,成功次数为 r r r 之前的失败次数的概率分布。表示成:
x ∼ N B ( r , p ) x\sim NB(r,p) xNB(r,p)

概率密度函数为:
Pr ⁡ ( x = k ) = C k + r − 1 k ( 1 − p ) k p r \Pr(x=k)=C_{k+r-1}^k(1-p)^kp^{r} Pr(x=k)=Ck+r1k(1p)kpr

为什么叫负二项,是因为:
C k + r − 1 k = ( − 1 ) k C − r k C_{k+r-1}^k=(-1)^kC_{-r}^{k} Ck+r1k=(1)kCrk

负二项分布可以视作泊松分布与伽马分布的混合,也可视作泊松分布与对数分布的复合。

泊松分布是一种离散概率分布,用于表示在一个固定间隔时间内某事件发生次数的概率。该分布由一个参数$\lambda$决定,代表单位时间内的平均发生率。 泊松分布的概率质量函数可以写作: $$ P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!} $$ 其中$k$是非负整数(0, 1, 2...),代表某个特定时间段内发生的次数。 负二项分布也是一种离散概率分布,通常用来建模一系列独立伯努利试验中,在达到固定的失败次数$r$之前成功的次数。当$r=1$时,这被称为几何分布负二项分布有两个参数:成功概率$p$和目标失败次数$r$。 负二项分布的概率质量函数如下所示: $$ P(X=k) = {k+r-1 \choose r-1} p^{r}(1-p)^{k} $$ 这里$k$同样是一个非负整数,代表在第$r$次失败前的成功次数。 两者的主要区别在于方差与均值的关系上。对于泊松分布来说,均值等于方差($E[X] = Var(X)$),而对于负二项分布而言,方差总是大于均值($Var(X)> E[X]$)。这种过分散现象使得负二项分布在处理某些类型的计数数据方面比泊松分布更为合适,例如基因表达数据分析中的RNA序列读取数量变化较大情况下的应用。 应用场景对比: - **泊松分布**常应用于模拟稀有事件的发生频率,比如每小时进入商店的顾客人数、放射性物质衰变粒子的数量或者电话呼叫中心接到的来电数目等场景下。 - **负二项分布**则更多地出现在需要考虑额外变异的情况下,即观测到的数据展示出超过理论预测范围的变化程度之时。这类情形包括但不限于生物信息学领域里不同样本间的基因表达水平测量误差较大的案例研究之中。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

心态与习惯

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值