一、二项分布的性质与计算
1 二项分布的性质
在概率空间为
的n重伯努利试验中,事件
出现的概率记为
。事件
那么恰好出现
次的概率为
。
这里的
被称为
二项分布。
课本给出了20重伯努利试验分别在
时会出现事件
的次数为
的对应的概率值,并绘制成了一个折线图。我们便可以直观地体会并理解到二项分布的性质。
在此我们做一个简单的分析。由于
。当
时,
关于变量
单调递增,当
时,
单调递减。
2 产品抽样验收与(n,c)方案
抽样检验是生产管理中的必要手段,检验的原则是次品率小于等于某一临界值时 , 认为此批产品为合格品,否则认为不合格品。而这个原则在实际操作时采用如下方案:抽检
件产品,仅当次品数不大于
件时认为此批产品为合格品,否则为不合格品,称这种方案为
(n,c)方案。
这样抽样调查的结果
和
的选择显然不是固定的或绝对的,而是人为选择的。但不恰当的选择有可能会导致生产者风险(拒收过多合格品)或者消费者风险(接受过多残次品),那我们应当如何选择这两个数字?
首先我们记
为真实的
废品率,
为在废品率
时
接收这批产品的概率。这时如果抽样的方式是可放回的或者样品量十分庞大,我们可以把看其为二项分布
。这时候我们视情况需要找两个比较小的整数
去限制
和
,
。
的曲线被称为
抽检特性曲线,简称
OC曲线。
二、二项分布的泊松逼近
在二项分布的计算中,当n很大时,计算相当复杂。为了简化计算,我们试图找到一个方便使用的近似公式。
做到这一想法的是泊松定理。 在独立试验中,以
代表事件
在试验中出现的概率,它与试验次数
有关,如果
,则当
。
定理的证明置于文末。
这个在应用中的表现为当
非常小
,
又比较大的时候
的时候,一般理解为
,用近似公式
作计算。
三、泊松分布
在上文的叙述中,泊松定理实际上可以理解为给出了一个新的分布,我们称之为泊松分布:
,
为一个正参数。
这个分布非常重要,在生物学、医学、工业统计、保险科学及公用事业的排队等大量问题中很常见。
接下来我们进一步研究泊松分布的机理,我们首先有柯西引理:
若
是一个连续函数(或者单调函数),且对
(或
)成立
,则
。
引理的证明置于文末。
随后我们考虑泊松过程:
考虑来到某交换装置的电话呼叫次数为例来作说明,其有三个性质。由这三个性质能推导电话呼叫次数服从泊松分布。
(1)平稳性 对于时间段
内发生的呼叫次数只与
有关而与
无关。而且
,记
为时长
的时间里发生了
次呼叫,那么有
。
(2)独立增量性(无后效性) 对于时间段
内发生的呼叫次数与
以前发生的事件都相互独立,且在互不相交的时间区间内事件发生是相互独立的。
(3)普通性 在充分小的时间间隔内,最多来一个呼叫。
。在这个条件下,意味着同时进来两个或以上的通话是不可能的。
由独立增量性与全概率公式可得
。
特别地,我们有
,而且会是一个关于
的单调递减函数,结合本节中的柯西引理那么有
。而这里无论是
或者
都不是符合概率的性质或者不是我们想要的结果。我们考虑
,那么一定
。
利用上述式子,当
时,可以得到
(误差大小为
)
(误差大小为
)
。
回到最开始的式子,
。
那么也就会有
。
前面我们已知
,又知任意一个
对应的导数,也即
随
变化的变化量。那么我们就可以解得一切的
:
。
至此我们将泊松分布成功推导了出来。
APPENDIX
2.柯西引理:若
是一个连续函数(或者单调函数),且对
(或
)成立
,则
。
证明:
由条件
我们可知对于
,有
。
于是我们便可不断迭代这一结果,对于
,有
。
这个地方我们取
,便得到
。
再利用条件里的式子,对于
,
。
这里由
的任意性,记
,那么对于
,有
。
现在再利用
的随机性或单调性,便能进一步推广到无理数成立。
证毕
(证明待更新)
雷咖吼:《概率论基础》目录zhuanlan.zhihu.com