通俗理解泊松分布

1.甜在心馒头店

  公司楼下有家馒头店:
在这里插入图片描述
  每天早上六点到十点营业,生意挺好,就是发愁一个事情,应该准备多少个馒头才能既不浪费又能充分供应?
  老板统计了一周每日卖出的馒头(为了方便计算和讲解,缩小了数据):
在这里插入图片描述

  均值为:

X ˉ = 3 + 7 + 4 + 6 + 5 5 = 5 \bar{X}=\frac{3+7+4+6+5}{5}=5 Xˉ=53+7+4+6+5=5

  按道理讲均值是不错的选择,但是如果每天准备5个馒头的话,从统计表来看,至少有两天不够卖,40% 的时间不够卖:
在这里插入图片描述

  你“甜在心馒头店”又不是小米,搞什么饥饿营销啊?老板当然也知道这一点,就拿起纸笔来开始思考。

2. 老板的思考

  老板尝试把营业时间抽象为一根线段,把这段时间用T来表示:

在这里插入图片描述
  然后把周一的三个馒头(“甜在心馒头”,有褶子的馒头)按照销售时间放在线段上:
在这里插入图片描述

  把 T 均分为四个时间段:

  此时,在每一个时间段上,要不卖出了(一个)馒头,要不没有卖出:
image
  在每个时间段,就有点像抛硬币,要不是正面(卖出),要不是反面(没有卖出):
在这里插入图片描述
  T内卖出3个馒头的概率,就和抛了4次硬币(4个时间段),其中3次正面(卖出3个)的概率一样了。
  这样的概率通过二项分布来计算就是:

C 4 3 p 3 ( 1 − p ) 1 C_4^3p^3(1-p)^1 C43p3(1p)1

  但是,如果把周二的七个馒头放在线段上,分成四段就不够了:

  从图中看,每个时间段,有卖出3个的,有卖出2个的,有卖出1个的,就不再是单纯的“卖出、没卖出”了。不能套用二项分布了。

  解决这个问题也很简单,把 T 分为20个时间段,那么每个时间段就又变为了抛硬币:

在这里插入图片描述
  这样,T内卖出7个馒头的概率就是(相当于抛了20次硬币,出现7次正面)

C 20 7 p 7 ( 1 − p ) 13 C_{20}^7p^7(1-p)^{13} C207p7(1p)13

  为了保证在一个时间段内只会发生“卖出、没卖出”,干脆把时间切成 n 份:

C n 7 p 7 ( 1 − p ) n − 7 C_{n}^7p^7(1-p)^{n-7} Cn7p7(1p)n7

  越细越好,用极限来表示:

lim ⁡ n → + ∞ C n 7 p 7 ( 1 − p ) n − 7 {\lim\limits_{n\to+\infty}}C_{n}^7p^7(1-p)^{n-7} n+limCn7p7(1p)n7

  更抽象一点,T 时刻内卖出 k 个馒头的概率为:

lim ⁡ n → + ∞ C n k p k ( 1 − p ) n − k {\lim\limits_{n\to+\infty}}C_{n}^kp^k(1-p)^{n-k} n+limCnkpk(1p)nk

3.p的计算

  “那么”,老板用笔敲了敲桌子,“只剩下一个问题,概率 p 怎么求?”
  在上面的假设下,问题已经被转为了二项分布。二项分布的期望为:

E ( X ) = n p = μ E(X)=np=\mu E(X)=np=μ

  那么:

p = μ n p=\frac{\mu}{n} p=nμ

4.泊松分布

  有了 p = μ n p=\frac{\mu}{n} p=nμ了之后,就有:

lim ⁡ n → ∞ ( n k ) p k ( 1 − p ) n − k = lim ⁡ n → ∞ ( n k ) ( μ n ) k ( 1 − μ n ) n − k \lim\limits_{n\to\infty}\binom{n}{k}p^k(1-p)^{n-k}=\lim\limits_{n\to\infty}\binom{n}{k}\left(\frac{\mu}{n}\right)^k(1-\frac{\mu}{n})^{n-k} nlim(kn)pk(1p)nk=nlim(kn)(nμ)k(1nμ)nk

  我们来算一下这个极限:

lim ⁡ n → ∞ ( n k ) ( μ n ) k ( 1 − μ n ) n − k = lim ⁡ n → ∞ n ( n − 1 ) ( n − 2 ) ⋯ ( n − k + 1 ) k ! μ k n k ( 1 − μ n ) n − k = lim ⁡ n → ∞ μ k k ! n n ⋅ n − 1 n ⋯ n − k + 1 n ( 1 − μ n ) − k ( 1 − μ n ) n \begin{array}{l l l} \lim\limits_{n\to\infty}\binom{n}{k}\left(\frac{\mu}{n}\right)^k(1-\frac{\mu}{n})^{n-k} \\ \\ = \lim\limits_{n\to\infty}\frac{n(n-1)(n-2)\cdots(n-k+1)}{k!}\frac{\mu^k}{n^k}\left(1-\frac{\mu}{n}\right)^{n-k} \\ \\ = \lim\limits_{n\to\infty}\frac{\mu^k}{k!}\frac{n}{n}\cdot\frac{n-1}{n}\cdots\frac{n-k+1}{n}\left(1-\frac{\mu}{n}\right)^{-k}\left(1-\frac{\mu}{n}\right)^n \end{array} nlim(kn)(nμ)k(1nμ)nk=nlimk!n(n1)(n2)(nk+1)nkμk(1nμ)nk=nlimk!μknnnn1nnk+1(1nμ)k(1nμ)n

  其中

lim ⁡ n → ∞ n n ⋅ n − 1 n ⋯ n − k + 1 n ( 1 − μ n ) − k = 1 \lim\limits_{n\to\infty}\frac{n}{n}\cdot\frac{n-1}{n}\cdots\frac{n-k+1}{n}\left(1-\frac{\mu}{n}\right)^{-k}=1 nlimnnnn1nnk+1(1nμ)k=1

lim ⁡ n → ∞ ( 1 − μ n ) n = e − μ \lim\limits_{n \to \infty}\left(1-\frac{\mu}{n}\right)^n = e^{-\mu} nlim(1nμ)n=eμ

  所以:

lim ⁡ n → ∞ ( n k ) ( μ n ) k ( 1 − μ n ) n − k = μ k k ! e − μ \lim\limits_{n\to\infty}\binom{n}{k}\left(\frac{\mu}{n}\right)^k(1-\frac{\mu}{n})^{n-k}=\frac{\mu^k}{k!}e^{-\mu} nlim(kn)(nμ)k(1nμ)nk=k!μkeμ

  上面就是泊松分布的概率密度函数,也就是说,在 T 时间内卖出 k 个馒头的概率为:

P ( X = k ) = μ k k ! e − μ P(X=k)=\frac{\mu^k}{k!}e^{-\mu} P(X=k)=k!μkeμ

  一般来说,我们会换一个符号,让 μ = λ \mu=\lambda μ=λ ,所以:

P ( X = k ) = λ k k ! e − λ P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda} P(X=k)=k!λkeλ

  这就是教科书中的泊松分布的概率密度函数.

5.馒头店的问题的解决

  老板依然蹙眉,不知道 μ \mu μ啊?
  没关系,刚才不是计算了样本均值:

X ‾ = 5 \overline{X}=5 X=5

  可以用它来近似:

X ‾ ≈ μ \overline{X}\approx\mu Xμ

  于是:

P ( X = k ) = 5 k k ! e − 5 P(X=k)=\frac{5^k}{k!}e^{-5} P(X=k)=k!5ke5

  画出概率密度函数的曲线就是:
在这里插入图片描述

  可以看到,如果每天准备8个馒头的话,那么足够卖的概率就是把前8个的概率加起来:
在这里插入图片描述
  这样 93% 的情况够用,偶尔卖缺货也有助于品牌形象。
  老板算出一脑门的汗,“那就这么定了!”

6.二项分布与泊松分布

  鉴于二项分布与泊松分布的关系,可以很自然的得到一个推论,当二项分布的p很小的时候,两者比较接近:
在这里插入图片描述

  • 34
    点赞
  • 80
    收藏
    觉得还不错? 一键收藏
  • 11
    评论
评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值