原文地址1:https://www.face2ai.com/Math-Probability-5-7-The-Gamma-Distributions-P2转载请标明出处
Abstract: 本文介绍Gamma分布相关知识的第二部分指数分布
Keywords: The Exponential Distributions
Gama分布
怀疑是我们学习路上最大的绊脚石,因为学习完很多东西都不是立刻就能变现的,或者能直接在生活中能体现出变化的。所以能看长线的人,才适合进行长期学习,量变到质变的过程,而我们最重要的就是排除万难,坚定信念,至于结果如何,我相信古人的总结。
本文介绍的Gamma分布知识的第二部分有一个自己的名字,叫做指数分布,Gamma分布之所以叫Gamma分布是因为其中包含Gamma函数,而其中某个参数的特殊化产生的新分布,就是我们今天要学习的指数分布(The Exponential Distribution)。
指数分布一般用来建模等待时间等情况下的概率模型。
指数分布 The Exponential Distribution
我们上面一篇大讲特讲的服务时间例子,就是一个典型的等待时间的情况,所以,本文介绍的分布族可以用来进行建模
Definition Exponential Distributions.Let β > 0 \beta >0 β>0 .A random variable X X X has the exponential distribution with parameter β \beta β if X X X has a continuous distribution with the p.d.f.
f ( x β ) = { β e − β x for x > 0 0 for x ≤ 0 f(x\beta)= \begin{cases} \beta e^{-\beta x}& \text{ for }x>0\\ 0&\text{for} x\leq 0 \end{cases} f(xβ)={βe−βx0 for x>0forx≤0
这就是指数分布的定义,还是想之前说的,定义就是对这个在什么情况下分布是什么样子的进行定义,然后我们接下来要做的是通过这个定义能产生多少相关的定理结论。
作为对比,我们来列出Gamma分布,进行对比就能清楚地知道一些性质了,Gamma分布
Gamma Distributions.Let
α
\alpha
α and
β
\beta
β be positive numbers.A random variable
X
X
X has the gamma distribution with parameters
α
\alpha
α and
β
\beta
β if
X
X
X has a continuous distribution for which the p.d.f. is
f
(
x
∣
α
,
β
)
=
{
β
α
Γ
(
α
)
x
α
−
1
e
−
β
x
for
x
>
0
0
otherwise
f(x|\alpha,\beta)= \begin{cases} \frac{\beta^\alpha}{\Gamma(\alpha)}x^{\alpha-1}e^{-\beta x}&\text{ for } x>0\\ 0&\text{otherwise} \end{cases}
f(x∣α,β)={Γ(α)βαxα−1e−βx0 for x>0otherwise
因为Gamma函数在 Γ ( 1 ) = 1 \Gamma(1)=1 Γ(1)=1 所以,指数分布就是Gamma分布 α = 1 \alpha=1 α=1 的时候产生的分布。
Theorem The exponential distribution with parameter β \beta β is the same as the gamma distribution with parameters α = 1 \alpha=1 α=1 and β \beta β .If X X X has the exponential distribution with parameter β \beta β ,then
E ( X ) = 1 β and V a r ( X ) = 1 β 2 E(X)=\frac{1}{\beta}\text{ and } Var(X)=\frac{1}{\beta^2} E(X)=β1 and Var(X)=β21
and m.g.f. of X X X is
Ψ ( t ) = β β − t for t < β \Psi(t)=\frac{\beta}{\beta-t}\text{ for } t<\beta Ψ(t)=β−tβ for t<β
这个证明就不需要了,因为完全就是Gamma分布的代数结果,所以我们还是看点有用的性质吧,比如说,无记忆性。
Theorem Memoryless Property of Exponential Distributions.Let X X X have the exponential distribution with parameters β \beta β ,and let t > 0 t>0 t>0 .Then for every number h > 0 h>0 h>0 ,
P r ( X ≥ t + h ∣ X ≥ t ) = P r ( X ≥ h ) Pr(X\geq t+h|X\geq t)=Pr(X\geq h) Pr(X≥t+h∣X≥t)=Pr(X≥h)
证明:
对于每一个
t
>
0
t>0
t>0 ,
P
r
(
X
≥
t
)
=
∫
t
∞
β
e
−
β
x
d
x
=
e
−
β
t
(5.7.19)
Pr(X\geq t)=\int^{\infty}_{t}\beta e^{-\beta x}dx=e^{-\beta t}\tag{5.7.19}
Pr(X≥t)=∫t∞βe−βxdx=e−βt(5.7.19)
那么对于每一个
t
>
0
t > 0
t>0 以及
h
>
0
h > 0
h>0 我们有
P
r
(
X
≥
t
+
h
∣
X
≥
t
)
=
P
r
(
X
≥
t
+
h
)
P
r
(
X
≥
t
)
=
e
−
β
(
t
+
h
)
e
−
β
t
=
e
−
β
h
=
P
r
(
X
≥
h
)
(5.7.20)
\begin{aligned} Pr(X\geq t+h|X\geq t)&=\frac{Pr(X\geq t+h)}{Pr(X\geq t)}\\ &=\frac{e^{-\beta(t+h)}}{e^{-\beta t}}=e^{-\beta h}=Pr(X\geq h) \end{aligned}\tag{5.7.20}
Pr(X≥t+h∣X≥t)=Pr(X≥t)Pr(X≥t+h)=e−βte−β(t+h)=e−βh=Pr(X≥h)(5.7.20)
证明过程只用到了条件分布的求法,其他基本没有任何难度,这个结论是显然成立的。
值得说明的是,指数分布是在连续随机变量里面唯一一个就有无记忆性的分布;为了说明无记忆性,我们来看看思路:假设 X X X 表示某个任务触发前的等待时间,根据式5.7.20 如果从时间0开始计时前t个时间单位没有任务触发,那么在接下来 h h h 个时间单位触发任务的概率为 e − β h e^{-\beta h} e−βh 这个概率和从时间 0 0 0 开始计时前 h h h 个时间周期触发任务的概率一致.
但是必须要说明的是,无记忆性并不只是适合所有场景,比如假设
X
X
X 是 一个 灯泡的的寿命,就是他坏掉之前持续点亮的时间,这个灯泡以后能点亮的时间完全取决于已经点亮了多久,因此单一灯泡不具有无记忆性,但是指数分布可以很好的近似产品或者零件的寿命。
下面我们就看看如何使用指数分布来建模使用寿命。
使用寿命测试 Life Tests
🌰 :
假设有
n
n
n 个灯泡点亮,来模拟检测他们的使用寿命,我们假设他们每个的使用寿命相互独立,并且有相同的分布,参数为
β
\beta
β 的指数分布,换句话说,如果
X
i
X_i
Xi 定义第
i
i
i 个灯泡的寿命
i
=
1
,
2
,
…
,
n
i=1,2,\dots,n
i=1,2,…,n 然后假设他们是i.i.d的,那么第一个问题,就是我们假设
Y
1
Y_1
Y1 是
n
n
n 个灯泡中第一个坏掉的灯泡点亮的时间,那么其分布是什么样的?那么第二个坏掉的灯泡点亮的时间
Y
2
Y_2
Y2 又是怎么分布的呢?
分析:例子中
Y
1
Y_1
Y1 的分布式
n
n
n 个指数分布随机变量中最小的,那么其分布应该比较容易计算。
Theorem Suppose that the variables X 1 , … , X n X_1,\dots,X_n X1,…,Xn form a random sample from the exponential distribution with parameter β \beta β .Then the distribution of Y 1 = m i n X 1 , … , X n Y_1=min{X_1,\dots,X_n} Y1=minX1,…,Xn will be the exponential distribution with parameter n β n\beta nβ
定理说,n个独立同分布的指数分布的随机变量中最小的那个的新随机变量的分布是参数是 n β n\beta nβ 的指数分布。
证明:
对于每一个
t
>
0
t>0
t>0 那么:
P
r
(
Y
1
>
t
)
=
P
r
(
X
1
>
t
,
…
,
X
n
>
t
)
=
P
r
(
X
1
>
t
)
…
P
r
(
X
n
>
t
)
=
e
−
β
t
…
e
−
β
t
=
e
−
n
β
t
\begin{aligned} Pr(Y_1>t)&=Pr(X_1>t,\dots,X_n>t)\\ &=Pr(X_1>t)\dots Pr(X_n>t)\\ &=e^{-\beta t}\dots e^{-\beta t}=e^{-n\beta t} \end{aligned}
Pr(Y1>t)=Pr(X1>t,…,Xn>t)=Pr(X1>t)…Pr(Xn>t)=e−βt…e−βt=e−nβt
根据计算过程5.7.19可以比较轻松地得到上述结论。
根据无记忆性,对于例子中 Y 2 Y_2 Y2 的求法相当于从n个灯泡中有一个已经坏了的情况下,从新开始进行指数分布,也就是说当第一个灯泡坏了以后,我们重新开始进行试验,此时的时间归为0,那么参数变成了 n − 1 n-1 n−1 个灯泡,我们假设其中 第 j j j 个灯泡先坏掉( 1 < j < n 1<j<n 1<j<n ) 那么第二个坏掉的分布就是参数为 ( n − 1 ) β (n-1)\beta (n−1)β 的指数分布。
那么我们接下来就有研究每次灯泡熄灭之间的时间间隔了。
Theorem Suppose that the variables X 1 , … , X n X_1,\dots,X_n X1,…,Xn form a random sample from the exponential distribution with parameters β \beta β .Let Z 1 ≤ Z 2 ⋯ ≤ Z n Z_1\leq Z_2\dots \leq Z_n Z1≤Z2⋯≤Zn be the random variables X 1 , … , X n X_1,\dots,X_n X1,…,Xn sorted from smallest to largest.For each k = 2 , … , n k=2,\dots,n k=2,…,n ,let Y k = Z k − Z k − 1 Y_k=Z_k-Z_{k-1} Yk=Zk−Zk−1 ,Then the distribution of Y k Y_k Yk is the exponential distribution with parameter ( n + 1 − k ) β (n+1-k)\beta (n+1−k)β
上述定理说明指数分布的随机变量 X 1 , … , X n X_1,\dots,X_n X1,…,Xn 有参数 β \beta β 那么假设 Z 1 ≤ Z 2 ⋯ ≤ Z n Z_1\leq Z_2\dots \leq Z_n Z1≤Z2⋯≤Zn 是 X 1 , … , X n X_1,\dots,X_n X1,…,Xn 从小到大的排列 ,对于每一个 Y k = Z k − Z k − 1 Y_k=Z_k-Z_{k-1} Yk=Zk−Zk−1 其中 k = 2 , … , n k=2,\dots,n k=2,…,n 那么 Y k Y_k Yk也是指数分布,并且其参数是 ( n + 1 − k ) β (n+1-k)\beta (n+1−k)β 。
这个看起来就有点神奇了,但是证明过后发现,确实如此。
证明:
在时间
Z
k
−
1
Z_{k-1}
Zk−1 ,有
k
−
1
k-1
k−1 个寿命已经结束了,有
n
+
1
−
k
n+1-k
n+1−k 个还没坏,那么根据上一个例子,剩下的活着的的依然遵守无记忆性性质,依然服从指数分布,其参数为
β
\beta
β ,所以
Y
k
=
Z
k
−
Z
k
−
1
Y_k=Z_k- Z_{k-1}
Yk=Zk−Zk−1 也是活着的最小寿命时间分布,还是参数为
β
\beta
β 的指数分布,只不过试验总数变成了
n
+
1
−
k
n+1-k
n+1−k 个,所以根据定理 5.7.10 指数分布参数为
(
n
+
1
−
k
)
β
(n+1-k)\beta
(n+1−k)β
接下来我们研究一下,泊松过程和指数分布之间的关系。
指数分布和泊松过程的关系 Relation to Poisson Process
回顾下泊松分布的提出,当时提出泊松分布的情况是为了计算某段时间内到达商店的顾客数量,当时假定平均每个小时有多少人,然后按照伯努利过程抽象最小时间单位比如秒内是否有人来,然后得出一段时的二项分布,发现二项分布太麻烦,于是用泊松分布来近似此情况下的二项分布,用于建模某段时间内的客户数量,但是,当我们想要知道每两个相邻进店的客户之间间隔了多少时间,这时候就可以用指数分布来进行建模了
Theorem 5.7.12 Times between Arrivales in a Poisson Process.Suppose that arrivals occur according a Poisson process with rate β \beta β .Let Z k Z_k Zk be the time until the k k k th arrival for k = 1 , 2 , … k=1,2,\dots k=1,2,… .Define Y 1 = Z 1 Y_1=Z_1 Y1=Z1 and Y k = Z k − Z k − 1 Y_k=Z_k-Z_{k-1} Yk=Zk−Zk−1 for k ≥ 2 k\geq 2 k≥2 Then Y 1 , Y 2 , … Y_1,Y_2,\dots Y1,Y2,… are i.i.d. and they each have the exponential distribution with parameter β \beta β
证明,假设泊松分布的变量为 X ,那么当 Y 1 ≤ t Y_1\leq t Y1≤t 时对应的 X ≥ 1 X\geq 1 X≥1 应该等于 1 − P r ( X = 0 ) = 1 − e − β t 1-Pr(X=0)=1-e^{-\beta t} 1−Pr(X=0)=1−e−βt 可以看出上式是指数分布的c.d.f。其参数是 β \beta β
泊松过程中,两个到达之间的时间可以用指数分布来建模。
根据定理5.7.7 和 5.7.12 可以得出以下推论。
Corollary Time until k k k th Arrival. In the situation of Theorem 5.7.12,the distribution of Z k Z_k Zk is the gamma distribution with paramters k k k and β \beta β
总结
本文在上文Gamma分布上进行特例,得到一中经常由于建模使用寿命,或者泊松过程时间间隔的分布——指数分布。
下一篇我们继续啊在Gamma分布的基础上构建其他类型的分布。
待续。。。