概率基础——泊松分布

最新推荐文章于 2024-08-08 19:26:43 发布

Persist_Zhang

最新推荐文章于 2024-08-08 19:26:43 发布

阅读量1.3w

点赞数 45

分类专栏：数据分析 Python 文章标签：概率论

本文链接：https://blog.csdn.net/weixin_39753819/article/details/136116435

版权

Python 同时被 2 个专栏收录

131 篇文章

订阅专栏

数据分析

101 篇文章

订阅专栏

概率基础——泊松分布

介绍

在统计学中，泊松分布是一种用来描述单位时间（或空间）内事件发生次数的概率分布。它常被用来模拟稀有事件在固定时间或空间内的发生情况。泊松分布有着许多实际应用，尤其是在描述随机事件的计数过程中。

理论及公式

泊松分布的概率质量函数（PMF）为：

$\frac{e^{-\lambda} \lambda^k}{k!}$

其中， $k$ 表示事件发生的次数， $\lambda$ 是单位时间（或空间）内事件发生的平均次数。

理论背景

泊松分布的出现是基于二项分布的一种极限情况。具体来说，当二项分布的试验次数 ( n ) 很大，每次试验成功的概率 $p$ 很小，但是试验次数 $n$ 乘以成功概率 $p$ 的期望值 $n p$ 保持适中时，二项分布可以近似为泊松分布。这种情况下，泊松分布的参数 $\lambda$ 即为 $n p$ 。

示例与应用

一个典型的例子是飞机事故的发生情况。假设我们将一天内所有飞机起飞和降落的次数视为一系列独立同分布的伯努利试验，每次试验成功的概率 $p$ 即是一架飞机出现事故的概率，而试验次数 $n$ 则是一天内飞机起飞和降落的总次数。在这种情况下，如果 $n$ 很大而 $p$ 很小，使得 $n p$ 保持适中，那么飞机事故的总数就可以用泊松分布来近似描述。

import matplotlib.pyplot as plt
from scipy.stats import poisson

# 参数设置
lambd = 5  # 平均发生次数

# x范围为0到20，即事件发生的次数范围
x = range(0, 21)
params = [10, 5]

fig, ax = plt.subplots(2, 1, figsize=(10, 6))
for i in range(len(params)):
    poisson_rv = poisson(mu=params[i])
    mean, var, skew, kurt = poisson_rv.stats(moments='mvsk')
    ax[i].plot(x, poisson_rv.pmf(x), 'ro', lw=5, alpha=0.6, ms=8)
    ax[i].vlines(x, 0, poisson_rv.pmf(x), colors='r', lw=5)
    ax[i].set_title(r'$\lambda$ = %d' % params[i])
    ax[i].set_xticks(x)
    ax[i].grid(ls='--')
    # 打印信息
    print('$\lambda$={}, E[X]={}，V[X]={}'.format(params[i], mean, var))

plt.show()

在这里插入图片描述

对 $\lambda=5$ 的泊松分布进行采样，代码如下：

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import poisson

# 参数设置
lambda_ = 5  # 平均发生次数

data = poisson.rvs(lambda_, size=100000)

plt.figure()
plt.hist(data, density=True, alpha=0.7, edgecolor='b')
plt.gca().set_xticks(range(0, 15))

# 打印信息
print('E[X]={:.2f}, V[X]={:.2f}'.format(np.mean(data), np.var(data)))
plt.grid(ls='--')
plt.show()

在这里插入图片描述
输出结果为：

通过10万次采样试验得出统计结论，根据结果计算均值和方差，与模型的理论推导值一致。

结论

通过绘制泊松分布的概率质量函数图，可以清晰地看到其钟形曲线特征。随着事件发生次数增加，概率质量逐渐下降，但总体上形成一个对称的分布。这种形式适用于描述稀有事件的发生情况，其中平均发生次数 $\lambda$ 起到关键作用。泊松分布的应用广泛，特别是在各种计数过程中，如电话呼入量、网站访问量、交通事故发生数等。对于以上例子中的飞机事故，泊松分布的使用能够为我们提供有效的建模方法，从而更好地理解和预测事件的发生情况。