概率基础——指数分布

最新推荐文章于 2024-05-24 19:27:41 发布

Persist_Zhang

最新推荐文章于 2024-05-24 19:27:41 发布

阅读量6.1k

点赞数 36

分类专栏：数据分析 Python 文章标签： python 概率论

本文链接：https://blog.csdn.net/weixin_39753819/article/details/136187299

版权

Python 同时被 2 个专栏收录

131 篇文章

订阅专栏

数据分析

101 篇文章

订阅专栏

概率基础——指数分布

介绍

指数分布是一种连续概率分布，描述了独立随机事件之间的时间间隔。它常被用来模拟随机事件的等待时间，例如到达下一位顾客的等待时间、设备故障的间隔时间等。指数分布具有无记忆性的特点，即在给定时间内没有发生事件并不会影响下一次事件发生的概率。

理论及公式

指数分布的概率密度函数（PDF）为：

$f(x;\lambda) = \lambda e^{-\lambda x}$

其中， $\geq 0$ 表示时间间隔， $\lambda > 0$ 是指数分布的参数，也称为速率参数。参数 $\lambda$ 表示单位时间（或单位长度）内发生事件的平均次数。

指数分布的参数

速率参数 $\lambda$ ：单位时间（或单位长度）内发生事件的平均次数。速率参数 $\lambda$ 越大，事件发生的速率越快；速率参数 $\lambda$ 越小，事件发生的速率越慢。

举例

假设某个公交车站的乘客到达时间间隔符合指数分布，参数 $\lambda = 0.1$ ，即平均每10分钟会有一个乘客到达。我们希望了解乘客到达的等待时间分布情况，以便优化公交车站的客流管理。

Python绘制不同参数的概率密度曲线

接下来，我们将使用Python来绘制不同参数的指数分布的概率密度曲线。

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import expon

# 定义不同参数的速率参数
lambdas = [0.5, 1, 2]

# 生成x轴的取值范围
x = np.linspace(0, 5, 1000)

# 绘制概率密度曲线
plt.figure(figsize=(10, 6))
for lam in lambdas:
    y = expon.pdf(x, scale=1/lam)
    plt.plot(x, y, label=f'lambda={lam}')

plt.title('Exponential Distribution PDF with Different Lambda')
plt.xlabel('x')
plt.ylabel('Probability Density')
plt.legend()
plt.grid(True)
plt.show()

在这里插入图片描述

以上代码将绘制出三条不同参数 $\lambda$ 的指数分布概率密度曲线，参数 $scale=1/\lambda$ 。从图中可以看出，不同参数的指数分布曲线具有不同的速率，速率参数 $\lambda$ 越大，曲线下降越快，事件发生的速率越快。
对指数型随机变量进行采样生成，对 $\lambda=1$ 的指数分布进行采样生成，代码如下：

from scipy.stats import expon
import matplotlib.pyplot as plt
import numpy as np

expon_rv = expon()
expon_rvs = expon_rv.rvs(size=100000)
x = np.linspace(0, 10, 1000)
plt.plot(x, expon_rv.pdf(x), 'r', lw=3, alpha=0.6, label="$\\lambda$=1")
plt.hist(expon_rvs, bins=100, density=True, alpha=0.75, edgecolor='black')
plt.grid(ls='--')
plt.legend()
plt.show()