1. Poisson随机现象
1.1 引言
文献[1]中的例子:
1898年由Ladislaus Bortkiewicz在《小数法则》中提出了一个实际应用的例子。当时他得到一个任务:调查1875到1894年的20年间普鲁士军队14个军团中偶然被马踢伤而致死的士兵数量。这 20×14= 280 个纪录, 见“./data/因马踢伤死亡士兵数.xlsx”,按死亡人数来分,则如下表左二栏所示:
表1-1 因马踢伤致死的士兵数
x=每年因马踢伤死亡士兵数 | 记录数(次/团年) |
---|---|
0 | 141 |
1 | 91 |
2 | 32 |
3 | 11 |
4 | 2 |
≥ 5 \ge 5 ≥5 | 0 |
问题:在20年内,理想中每团每年因马踢伤意外死亡的士兵人数 X X X的分布是什么样的。
1.2. 微分方程建模
Poisson随机变量建模的给定流体空间中稀有事件发生的次数,例如交通(流体空间)的事故(稀有事件)次数,股票市场(流体空间)中买入股票(稀有事件)的次数等。Poisson随机现象具有三个特性3:
(1) 在一个短区间 Δ z \Delta z Δz内,发生一次事件的概率与 Δ z \Delta z Δz成正比: η Δ z \eta \Delta z ηΔz 。
(2) 在短区间 Δ z \Delta z Δz内发生两次及以上事件的概率可以忽略。
(3) 在不重叠的短区间 Δ z \Delta z Δz段落里,事件各自发生的次数是独立的。
1.2.1 基本假设和定义
为了描述方便,将成功观察到稀有事件定义为二项式随机变量中,“正”事件,反之,未观察到稀有事件定义为“负”事件。对上文中的Poisson随机现象,以binomial随机变量为模型进行如下定义和假设:
- [1] 在单位区间长度 z z z内, Δ z \Delta z Δz是短区间长度,可以理解为 z z z的邻域。Poisson随机现象的特性(2)建模,在短区间 Δ z \Delta z Δz内观察到超过1次以上“正”事件的概率为0。(数学语言表示就是 lim Δ z → 0 O ( Δ z ) / Δ z = 0 \lim_{\Delta z\rightarrow 0}\mathcal{O(\Delta z)/\Delta z = 0} limΔz→0O(Δz)/Δz=0, O ( Δ z ) \mathcal{O(\Delta z)} O(Δz)表示短区间 Δ z \Delta z Δz中的发生“正”事件次数超过1的概率,被定义为高阶无穷小量。这个是Poisson随机现象的性质特点,)
- [2] p p p表示在短区间 Δ z \Delta z Δz内观察到1个"正"事件的概率, p p p与短区间 Δ z \Delta z Δz成正比。
p = η Δ z (1-1) p=\eta \Delta z\tag*{(1-1)} p=ηΔz(1-1)
式中, η \eta η是在单位区间 z z z上,发生“正”事件的概率,是个未知的常量。 - [3] 区间均匀性假设:在任何给定的短区间 Δ z \Delta z Δz上,“正”事件发生的概率相同。
- [4] 区间独立性假设:一个短区间 Δ z i \Delta z_i Δzi与任何其他不重叠的短区间 Δ z j \Delta z_j Δzj相互独立,互不影响。
- [5] 随机变量 X X X是在单位区间 z z z上,观察到“正”事件的次数。
使用二项式随机变量来建模,令二项式随机变量中伯努利试验次数 n n n非常大,而且 n = z / Δ z n=z/\Delta z n=z/Δz,每一个伯努利试验只有“正”和“反”两种结果。
1.2.2 建模
定义 P x ( z ) P_x(z) Px(z):
P x ( z ) = P ( X = x 在 区 间 z 内 ) (1-2) P_x(z)=P(X=x 在区间z内)\tag*{(1-2)} Px(z)=P(X=x在区间z内)(1-2)
在区间 z + Δ z z+\Delta z z+Δz内观察到“正”事件发生 x x x次的概率 P x ( z + Δ z ) P_x(z+\Delta z) Px(z+Δz):
P x ( z + Δ z ) = P ( E 1 + E 2 + E 3 ) (1-3) P_x(z+\Delta z)=P(E_1+E_2+E_3)\tag*{(1-3)} Px(z+Δz)=P(E1+E2+E3)(1-3)
式中:
E 1 E_1 E