认识生活中的泊松分布

● 每周一言

有些人推动生活走,有些人则被生活推着走。

导语

公交地铁站根据每天客流量的变化安排班次,银行根据每天的排号人数决定开放柜台数,包子粥铺根据每天卖出多少碗粥和多少个包子来充分备货……这一类常见的生活问题都和泊松分布息息相关。

那么,如何直观理解泊松分布?

泊松分布

要讲泊松分布,得先讲讲二项分布,因为泊松分布是二项分布的极限形式,是由二项分布的公式取极限推导而来。

fig1

二项分布,顾名思义,就是取值结果只有正负两种的分布,用数学语言描述就是关于n个独立的正负实验中成功次数的离散概率分布。

二项分布最典型的实验是抛硬币实验,抛n次硬币,有k次正面朝上的概率是多少?假设正面朝上的概率是p,根据排列组合,从n次中挑选出k次正面朝上,n-k次翻面朝上,发生的概率P为:

P=Ckn×pk×(1p)nk P = C n k × p k × ( 1 − p ) n − k

这个便是二项分布公式,二项分布公式的数学期望μ = np。

fig2

这个时候大家可能发现了,要计算发生k次的概率,在二项分布中必须事先知道一个全局的n才行。然而,在前文提到的实际生活问题中,我们很难或者无法预先知道对应的n是多少。

比如潜在乘坐公交车的乘客总数,潜在需要去银行办业务的客户总数,以及潜在包子粥铺顾客总数等。这里有一个前提假设,每一类人对相应事件的参与概率相同且互不影响,即独立同概率假设。

fig3

人数n未知,难道就没有办法求这个概率P了吗?聪明的小伙伴应该已经联想到了取n的极限来求解P。没错,这个取极限求解P正是泊松分布的推导过程。

P=limnCkn×pk×(1p)nk P = lim n → ∞ C n k × p k × ( 1 − p ) n − k

可知,上式中只剩下p是未知的,根据二项公式的数学期望μ = np,我们知道p= μ / n,带入上式并推导计算P的极限得:

P=P=P=limnCkn×(μn)k×(1μn)nklimnn(n1)(n2)...(nk+1)k!μknk(1μn)nklimnμkk!n(n1)...(nk+1)nk(1μn)k(1μn)n P = lim n → ∞ C n k × ( μ n ) k × ( 1 − μ n ) n − k P = lim n → ∞ n ( n − 1 ) ( n − 2 ) . . . ( n − k + 1 ) k ! μ k n k ( 1 − μ n ) n − k P = lim n → ∞ μ k k ! n ( n − 1 ) . . . ( n − k + 1 ) n k ( 1 − μ n ) − k ( 1 − μ n ) n

将上式各个部分拆开来计算,根据指数e的极限求法,我们能得到:

limnlimnn(n1)...(nk+1)nk(1μn)k=1(1μn)n=eμ lim n → ∞ n ( n − 1 ) . . . ( n − k + 1 ) n k ( 1 − μ n ) − k = 1 lim n → ∞ ( 1 − μ n ) n = e − μ

将上式带入极限求解,P的极限最终变成了只和k、μ相关的式子,即泊松分布公式。

Pk==limnCkn×pk×(1p)nkμkk!eμ(6) P k = lim n → ∞ C n k × p k × ( 1 − p ) n − k (6) = μ k k ! e − μ

有了泊松分布公式,已知均值μ,我们不需要知道总数n,就能求得k值对应的概率是多少。

fig4

拿之前的包子粥铺作为例子直观说明一下泊松分布公式的用法:已知包子粥铺历史每天平均卖出μ=100个包子,为了保证未来每天不够卖的概率低于10%,每天最少需要准备多少个包子?

假设最少需要准备n个包子,根据泊松公式可得如下不等式:

k=1nPk=k=1n100kk!e100>110%=0.9 ∑ k = 1 n P k = ∑ k = 1 n 100 k k ! e − 100 > 1 − 10 % = 0.9

可知,满足上式的最小n即为问题的解。

以上便是泊松分布的讲解,敬请期待下节内容。

结语

感谢各位的耐心阅读,后续文章于每周日奉上,敬请期待。欢迎大家关注小斗公众号 对半独白

face

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值