本篇博文我们讲介绍伽玛(
Γ
),卡方(
χ2
)与贝塔(
β
)分布。在高等微积分中已经证明过,对于
α>0
,积分
存在且积分值为正数,这个积分称为
α
的伽玛函数,写成
如果
α=1
,显然
如果
α>1
,用分部积分法可得
因此如果
α
是比1大的正整数,那么
因为 Γ(1)=1 ,这表明我们可以取 0!=1 。
我们用积分形式定义了
Γ(α)
,现在我们引入新变量
y=x/β
,其中
β>0
,那么
或者等价的
因为
α>0,β>0,Γ(α)>0
,所以
是连续型随机变量的pdf,有这种pdf形式的随机变量
X
满足参数为
注1:
伽玛分布是等待时间的概率模型;例如在寿命测试中,直到死亡的等待时间是用伽玛分布建模的随机变量。为了理解这个,假设泊松假定以及区间长度
w
是时间区间,特别地令随机变量
然而对于
w>0
,事件
W>w
等价于时间区间
w
内少于
读者需要证明
如果我们接受这个结论,那么对
w>0
我们有
且对于
w≤0,G(w)=0
。如果我们改变积分变量,将
z=λy
代入的
且对于
w≤0,G(w)=0
。所以
W
的pdf为
即
W
满足
W
满足参数为
接下来计算伽玛分布的mgf。因为
我们可以令
y=x(1−βt)/β,t<1/β
或者
x=βy/(1−βt)
得到
即
现在
且
因此对于伽玛分布我们有
且
例1:
令等待时间
W
满足
例2:
令
X
表示随机变量,使得
那么
X
的mgf为级数
然而这是
(1−3t)−4
的麦克劳林级数,假设
−1<3t<1
。因此
X
满足
注2:
伽玛分布不仅是等待时间的模型,也是许多非负连续型随机变量的模型。例如某些收入的分布可以用伽玛分布来建模,这是因为
α,β
提供了很大的灵活性,图
1
给出了几个伽玛概率密度函数。
图1
现在我们考虑伽玛分布的一个特例,即
且mgf为
那么称该变量满足卡方分布,任意这种形式的
f(x)
称为卡方pdf,卡方分布的均值与方差分别为
μ=αβ=(r/2)2=r,σ2=αβ2=(r/2)22=2r
,我们称参数
r
为卡方分布的自由度。因为卡方分布在统计中扮演着重要角色且经常出现,所以为了简洁
例3:
如果
X
满足pdf
那么
X
是
例4:
如果
X
有mgf
如果随机变量
X
是
这是因为
P(X=c2)=0
。为了计算概率,我们需要像
这样的值,这些值有表可供查询。
下面的结论之后还会用几次;因此我们用定理的形式给出。
定理1:
令
X
满足
证明:
注意
变量替换
u=x/2
可得
这就是要求的揭露。 ||
注意如果
k
是一个非负整数,那么
如果 P(a<X)=0.05 ,那么 P(X≤a)=0.95 ,通过查表可得 a=18.3 。
例6:
令
X
满足
如果
y≤0
,那么
G(y)=0
;但是如果
y>0
,那么
因此
Y
的pdf为
即
Y
是
伽玛分布最重要的一条性质是其加性。
定理2:
令
X1,…,Xn
是独立随机变量,假设对于
i=1,…,n
,
Xi
满足
Γ(αi,β)
分布,令
Y=Σni=1Xi
,那么
Y
满足
证明:
利用独立性与伽玛分布的mgf,对于
t<1/β
我们有
这就是 Γ(Σni=1αi,β) 分布的mgf。 ||
之后我们会用到 χ2 分布的一个性质,为了方便我们将结论以推论的形式给出,因为 β=2,Σαi=Σri/2 。
推论1:
令
X1,…,Xn
是独立随机变量,对于
i=1,…,n
,假设
Xi
满足
χ2(ri)
分布,令
Y=Σni=1Xi
,那么
Y
满足
最后在介绍一个重要的分布,即贝塔分布,它是由一对独立的
Γ
随机变量推导来的。令
X1,X2
是满足
Γ
分布的两个独立随机变量,其联合pdf为
其余地方为零,其中 α>0,β>0 。令 Y1=X1+X2 且 Y2=X1/(X1+X2) ,我们将说明 Y1,Y2 是独立的。
空间
是
x1x2
平面的第一象限,排除坐标轴上的点。那么
可以写成
x1=y1y2,x2=y1(1−y2)
,所以
这个变换时一对一的且将
映射到
y1y2
平面上的
={(y1,y2):0<y1<∞,0<y2<1}
,那么
Y1,Y2
的联合pdf为
所以他们是独立的随机变量。
Y2
的边缘pdf为
这个pdf就是参数为
α,β
的贝塔分布。因为
g(y1,y2)≡g1(y1)g2(y2)
,所以
Y1
的pdf一定为
这是参数值为 α+β,1 的伽玛分布。
很容易得出参数为
α,β
的贝塔分布其均值与方差分别为
最后这个例子中随机变量的分布是由伽玛随机变量变换推导出来的。
例7:
(狄利克雷函分布)令
X1,X2,…,Xk+1
是独立随机变量,每个都满足
β=1
的伽玛分布,这些变量的联合pdf可能写成
令
且
Yk+1=X1+X2+⋯+Xk+1
表示
k+1
个新变量,相关变换将
={(x1,…,xk+1):0<xi<∞,i=1,…,k+1}
映射到空间
单值逆函数是
x1=y1yk+1,…,xk=ykyk+1,xk+1=yk+1(1−y1−⋯−yk)
,使得雅克比为
因此
Y1,…,Yk,Yk+1
的联合pdf为
其余地方为零,这里
(y1,…,yk,yk+1)∈
。
Y1,…,Yk
的联合pdf为
0<yi,i=1,…,k,y1+⋯+yk<1
,函数
g
在其他地方等于零。有这种联合pdf形式的随机变量