推导过程整理自https://www.bilibili.com/video/BV1qf4y1R7FA。
文章目录
预备知识
Γ \Gamma Γ函数(伽马函数)
- 定义: Γ ( s ) = ∫ 0 + ∞ e − t t s − 1 d t \Gamma(s)=\int_{0}^{+\infty}e^{-t}t^{s-1}\text{d}t Γ(s)=∫0+∞e−tts−1dt
- 递推公式: Γ ( s + 1 ) = s Γ ( s ) , ( s > 0 ) \Gamma(s+1)=s\Gamma(s),\space(s>0) Γ(s+1)=sΓ(s), (s>0)
- 几个重要的值: Γ ( 1 ) = 1 \Gamma(1)=1 Γ(1)=1, Γ ( 1 2 ) = π \Gamma(\frac{1}{2})=\sqrt{\pi} Γ(21)=π
标准正态分布
- 概率密度函数: φ ( x ) = 1 2 π e − x 2 2 \varphi(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}} φ(x)=2π1e−2x2
- 分布函数: ϕ ( x ) = ∫ − ∞ x 1 2 π e − t 2 2 d t \phi(x)=\int_{-\infty}^{x}\frac{1}{\sqrt{2\pi}}e^{-\frac{t^2}{2}}\text{d}t ϕ(x)=∫−∞x2π1e−2t2dt
卡方分布
- 概率密度函数: p ( x ) = { 1 2 n / 2 Γ ( n / 2 ) e − x 2 x n 2 − 1 , x > 0 0 , x ⩽ 0 p(x)=\left\{\begin{array}{cc} \frac{1}{2^{n/2}\Gamma(n/2)}e^{-\frac{x}{2}}x^{\frac{n}{2}-1}, & x>0 \\ 0, & x\leqslant 0 \end{array}\right. p(x)={2n/2Γ(n/2)1e−2xx2n−1,0,x>0x⩽0
推导目标
已知 U U U服从卡方分布 χ 2 ( n 1 ) \chi^2(n_1) χ2(n1), V V V服从卡方分布 χ 2 ( n 2 ) \chi^2(n_2) χ2(n2),且 U U U与 V V V相互独立。
求 F = U / n 1 V / n 2 F=\frac{U/n_1}{V/n_2} F=V/n2U/n1的概率密度函数。
引理:连续型随机变量商的分布
设
(
X
,
Y
)
(X,Y)
(X,Y)为二维随机变量,其联合密度函数为
p
(
x
,
y
)
p(x,y)
p(x,y),则
Z
=
X
/
Y
Z=X/Y
Z=X/Y的密度函数
p
Z
(
z
)
p_{Z}(z)
pZ(z)满足
p
Z
(
z
)
=
∫
−
∞
+
∞
p
(
z
y
,
y
)
∣
y
∣
d
y
。
p_{Z}(z) = \int_{-\infty}^{+\infty}p(zy, y)|y|\text{d}y \thinspace。
pZ(z)=∫−∞+∞p(zy,y)∣y∣dy。
证明
使用分布函数法,先求 Z Z Z的分布函数,再对分布函数求导得到 p Z ( z ) p_{Z}(z) pZ(z)。
对 z z z的正负性进行讨论,得到积分区域如下图中阴影部分所示。
![]() |
![]() |
我们发现这两种情况可以合并,积分区域均为
{
(
y
,
x
)
∣
y
<
0
∧
x
⩾
z
y
}
\{(y,x) \space|\space y<0 \space\wedge\space x\geqslant zy\}
{(y,x) ∣ y<0 ∧ x⩾zy}
∪
\space\cup\space
∪
{
(
y
,
x
)
∣
y
>
0
∧
x
⩽
z
y
}
\{(y,x) \space|\space y>0 \space\wedge\space x\leqslant zy\}
{(y,x) ∣ y>0 ∧ x⩽zy}。于是有
F
Z
(
z
)
=
P
(
Z
<
z
)
=
P
(
X
Y
<
z
)
=
∫
−
∞
0
d
y
∫
y
z
+
∞
p
(
x
,
y
)
d
x
+
∫
0
+
∞
d
y
∫
−
∞
y
z
p
(
x
,
y
)
d
x
=
x
=
u
y
∫
−
∞
0
d
y
∫
z
+
∞
p
(
u
y
,
y
)
y
d
u
+
∫
0
+
∞
d
y
∫
−
∞
z
p
(
u
y
,
y
)
y
d
u
=
∫
z
+
∞
d
u
∫
−
∞
0
p
(
u
y
,
y
)
y
d
y
+
∫
−
∞
z
d
u
∫
0
+
∞
p
(
u
y
,
y
)
y
d
y
。
\begin{aligned} F_{Z}(z) &\space\space=\space\space P(Z<z) \\ &\space\space=\space\space P(\frac{X}{Y}<z) \\ &\space\space=\space\space \int_{-\infty}^{0}\text{d}y\int_{yz}^{+\infty}p(x,y)\text{d}x + \int_{0}^{+\infty}\text{d}y\int_{-\infty}^{yz}p(x,y)\text{d}x \\ &\overset{x=uy}{=} \int_{-\infty}^{0}\text{d}y\int_{z}^{+\infty}p(uy,y)y\text{d}u + \int_{0}^{+\infty}\text{d}y\int_{-\infty}^{z}p(uy,y)y\text{d}u \\ &\space\space=\space\space \int_{z}^{+\infty}\text{d}u\int_{-\infty}^{0}p(uy,y)y\text{d}y + \int_{-\infty}^{z}\text{d}u\int_{0}^{+\infty}p(uy,y)y\text{d}y \thinspace。 \end{aligned}
FZ(z) = P(Z<z) = P(YX<z) = ∫−∞0dy∫yz+∞p(x,y)dx+∫0+∞dy∫−∞yzp(x,y)dx=x=uy∫−∞0dy∫z+∞p(uy,y)ydu+∫0+∞dy∫−∞zp(uy,y)ydu = ∫z+∞du∫−∞0p(uy,y)ydy+∫−∞zdu∫0+∞p(uy,y)ydy。因此
p
Z
(
z
)
=
F
Z
′
(
z
)
=
−
∫
−
∞
0
p
(
z
y
,
y
)
y
d
y
+
∫
0
+
∞
p
(
z
y
,
y
)
y
d
y
=
∫
−
∞
+
∞
p
(
z
y
,
y
)
∣
y
∣
d
y
。
\begin{aligned} p_{Z}(z) &= F_{Z}'(z) \\ &= -\int_{-\infty}^{0}p(zy,y)y\text{d}y + \int_{0}^{+\infty}p(zy,y)y\text{d}y \\ &= \int_{-\infty}^{+\infty}p(zy,y)|y|\text{d}y \thinspace。 \end{aligned}
pZ(z)=FZ′(z)=−∫−∞0p(zy,y)ydy+∫0+∞p(zy,y)ydy=∫−∞+∞p(zy,y)∣y∣dy。
推导过程
先计算 X = U / n 1 X=U/n_1 X=U/n1和 Y = V / n 2 Y=V/n_2 Y=V/n2的概率密度函数
注意到 X = U / n 1 X=U/n_1 X=U/n1和 Y = V / n 2 Y=V/n_2 Y=V/n2具有相似的结构。我们只要计算出 X X X的概率密度函数,就可以用同样的方法得到 Y Y Y的概率密度函数。
设有 n n n个独立同分布的随机变量 Z 1 , Z 2 , ⋯ , Z n Z_1,Z_2,\cdots,Z_n Z1,Z2,⋯,Zn,它们均服从标准正态分布 N ( 0 , 1 ) N(0,1) N(0,1),则 Z = ∑ i = 1 n Z i 2 Z=\sum\limits_{i=1}^{n}Z_i^2 Z=i=1∑nZi2服从卡方分布 χ 2 ( n ) \chi^2(n) χ2(n)。我们接下来使用分布函数法计算 W = Z / n W=Z/n W=Z/n的概率密度函数 p W ( w ) p_{W}(w) pW(w)。
当
w
⩽
0
w\leqslant 0
w⩽0时,因为
W
=
Z
/
n
=
(
∑
i
=
1
n
Z
i
2
)
/
n
W=Z/n=(\sum\limits_{i=1}^{n}Z_i^2)/n
W=Z/n=(i=1∑nZi2)/n恒为非负,所以
P
(
W
<
w
)
=
0
P(W<w)=0
P(W<w)=0,从而
p
W
(
w
)
=
0
p_{W}(w)=0
pW(w)=0。下面针对
w
>
0
w>0
w>0的情况进行计算。
F
W
(
w
)
=
P
(
W
<
w
)
=
P
(
Z
<
n
w
)
=
∫
0
n
w
1
2
n
/
2
Γ
(
n
/
2
)
e
−
x
2
x
n
2
−
1
d
x
。
\begin{aligned} F_{W}(w) &= P(W<w) \\ &= P(Z<nw) \\ &= \int_{0}^{nw}\frac{1}{2^{n/2}\Gamma(n/2)}e^{-\frac{x}{2}}x^{\frac{n}{2}-1}\text{d}x \thinspace。 \end{aligned}
FW(w)=P(W<w)=P(Z<nw)=∫0nw2n/2Γ(n/2)1e−2xx2n−1dx。求导得
p
W
(
w
)
=
F
W
′
(
w
)
=
1
2
n
/
2
Γ
(
n
/
2
)
e
−
n
w
2
(
n
w
)
n
2
−
1
⋅
n
=
1
2
n
/
2
Γ
(
n
/
2
)
n
n
2
e
−
n
w
2
w
n
2
−
1
。
\begin{aligned} p_{W}(w) &= F_{W}'(w) \\ &= \frac{1}{2^{n/2}\Gamma(n/2)}e^{-\frac{nw}{2}}(nw)^{\frac{n}{2}-1}\cdot n \\ &= \frac{1}{2^{n/2}\Gamma(n/2)}n^{\frac{n}{2}} e^{-\frac{nw}{2}}w^{\frac{n}{2}-1} \thinspace。 \end{aligned}
pW(w)=FW′(w)=2n/2Γ(n/2)1e−2nw(nw)2n−1⋅n=2n/2Γ(n/2)1n2ne−2nww2n−1。
综上,有
p
W
(
w
)
=
{
1
2
n
/
2
Γ
(
n
/
2
)
n
n
2
e
−
n
w
2
w
n
2
−
1
,
w
>
0
0
,
w
⩽
0
。
p_{W}(w) = \left\{\begin{array}{cc} \frac{1}{2^{n/2}\Gamma(n/2)}n^{\frac{n}{2}} e^{-\frac{nw}{2}}w^{\frac{n}{2}-1}, & w>0 \\ 0, & w\leqslant 0 \end{array}\right. \thinspace。
pW(w)={2n/2Γ(n/2)1n2ne−2nww2n−1,0,w>0w⩽0。
因此
p
X
(
x
)
=
{
1
2
n
1
/
2
Γ
(
n
1
/
2
)
n
1
n
1
2
e
−
n
1
x
2
x
n
1
2
−
1
,
x
>
0
0
,
x
⩽
0
,
p_{X}(x) = \left\{\begin{array}{cc} \frac{1}{2^{n_1/2}\Gamma(n_1/2)}n_1^{\frac{n_1}{2}} e^{-\frac{n_1x}{2}}x^{\frac{n_1}{2}-1}, & x>0 \\ 0, & x\leqslant 0 \end{array}\right. \thinspace,
pX(x)={2n1/2Γ(n1/2)1n12n1e−2n1xx2n1−1,0,x>0x⩽0,
p Y ( y ) = { 1 2 n 2 / 2 Γ ( n 2 / 2 ) n 2 n 2 2 e − n 2 y 2 y n 2 2 − 1 , y > 0 0 , y ⩽ 0 。 p_{Y}(y) = \left\{\begin{array}{cc} \frac{1}{2^{n_2/2}\Gamma(n_2/2)}n_2^{\frac{n_2}{2}} e^{-\frac{n_2y}{2}}y^{\frac{n_2}{2}-1}, & y>0 \\ 0, & y\leqslant 0 \end{array}\right. \thinspace。 pY(y)={2n2/2Γ(n2/2)1n22n2e−2n2yy2n2−1,0,y>0y⩽0。
再计算 F = X Y F=\frac{X}{Y} F=YX概率密度函数 p F ( t ) p_{F}(t) pF(t)
当 t ⩽ 0 t\leqslant 0 t⩽0时,因为 X = U / n 1 X=U/n_1 X=U/n1和 Y = V / n 2 Y=V/n_2 Y=V/n2恒为非负,所以 P ( F < t ) = P ( X Y < t ) = 0 P(F<t)=P(\frac{X}{Y}<t)=0 P(F<t)=P(YX<t)=0,从而 p F ( t ) = 0 p_{F}(t)=0 pF(t)=0。下面针对 t > 0 t>0 t>0的情况进行计算。
因为
U
U
U与
V
V
V相互独立,所以
X
=
U
/
n
1
X=U/n_1
X=U/n1与
Y
=
V
/
n
2
Y=V/n_2
Y=V/n2也相互独立,于是
(
X
,
Y
)
(X,Y)
(X,Y)的联合概率密度函数
p
(
x
,
y
)
p(x,y)
p(x,y)满足
p
(
x
,
y
)
=
p
X
(
x
)
p
Y
(
y
)
。
p(x,y) = p_{X}(x)p_{Y}(y) \thinspace。
p(x,y)=pX(x)pY(y)。再根据引理,我们有
p
F
(
t
)
=
∫
−
∞
+
∞
p
(
t
y
,
y
)
∣
y
∣
d
y
=
∫
−
∞
+
∞
p
X
(
t
y
)
p
Y
(
y
)
∣
y
∣
d
y
=
∫
0
+
∞
p
X
(
t
y
)
p
Y
(
y
)
y
d
y
=
∫
0
+
∞
1
2
n
1
/
2
Γ
(
n
1
/
2
)
n
1
n
1
2
e
−
n
1
t
y
2
(
t
y
)
n
1
2
−
1
⋅
1
2
n
2
/
2
Γ
(
n
2
/
2
)
n
2
n
2
2
e
−
n
2
y
2
y
n
2
2
−
1
⋅
y
d
y
=
1
2
(
n
1
+
n
2
)
/
2
Γ
(
n
1
/
2
)
Γ
(
n
2
/
2
)
n
1
n
1
2
n
2
n
2
2
t
n
1
2
−
1
∫
0
+
∞
e
−
n
1
t
+
n
2
2
y
y
n
1
+
n
2
2
−
1
d
y
=
y
=
2
z
n
1
t
+
n
2
1
2
(
n
1
+
n
2
)
/
2
Γ
(
n
1
/
2
)
Γ
(
n
2
/
2
)
n
1
n
1
2
n
2
n
2
2
t
n
1
2
−
1
⋅
(
2
n
1
t
+
n
2
)
n
1
+
n
2
2
∫
0
+
∞
e
−
z
z
n
1
+
n
2
2
−
1
d
z
=
Γ
[
(
n
1
+
n
2
)
/
2
]
Γ
(
n
1
/
2
)
Γ
(
n
2
/
2
)
n
1
n
1
2
n
2
n
2
2
t
n
1
2
−
1
(
n
1
t
+
n
2
)
−
n
1
+
n
2
2
=
Γ
[
(
n
1
+
n
2
)
/
2
]
Γ
(
n
1
/
2
)
Γ
(
n
2
/
2
)
(
n
1
n
2
)
n
1
2
t
n
1
2
−
1
(
1
+
n
1
n
2
t
)
−
n
1
+
n
2
2
。
\begin{aligned} p_{F}(t) &\quad\,=\quad\, \int_{-\infty}^{+\infty}p(ty, y)|y|\text{d}y \\ &\quad\,=\quad\, \int_{-\infty}^{+\infty}p_{X}(ty)p_{Y}(y)|y|\text{d}y \\ &\quad\,=\quad\, \int_{0}^{+\infty}p_{X}(ty)p_{Y}(y)y\text{d}y \\ &\quad\,=\quad\, \int_{0}^{+\infty}\frac{1}{2^{n_1/2}\Gamma(n_1/2)}n_1^{\frac{n_1}{2}} e^{-\frac{n_1ty}{2}}(ty)^{\frac{n_1}{2}-1}\cdot \frac{1}{2^{n_2/2}\Gamma(n_2/2)}n_2^{\frac{n_2}{2}} e^{-\frac{n_2y}{2}}y^{\frac{n_2}{2}-1}\cdot y\text{d}y \\ &\quad\,=\quad\, \frac{1}{2^{(n_1+n_2)/2}\Gamma(n_1/2)\Gamma(n_2/2)}n_1^{\frac{n_1}{2}}n_2^{\frac{n_2}{2}}t^{\frac{n_1}{2}-1} \int_{0}^{+\infty}e^{-\frac{n_1t+n_2}{2}y}y^{\frac{n_1+n_2}{2}-1}\text{d}y \\ &\overset{y=\frac{2z}{n_1t+n_2}}{=} \frac{1}{2^{(n_1+n_2)/2}\Gamma(n_1/2)\Gamma(n_2/2)} n_1^{\frac{n_1}{2}}n_2^{\frac{n_2}{2}} t^{\frac{n_1}{2}-1}\cdot (\frac{2}{n_1t+n_2})^{\frac{n_1+n_2}{2}} \int_{0}^{+\infty}e^{-z}z^{\frac{n_1+n_2}{2}-1}\text{d}z \\ &\quad\,=\quad\, \frac{\Gamma[(n_1+n_2)/2]}{\Gamma(n_1/2)\Gamma(n_2/2)}n_1^{\frac{n_1}{2}}n_2^{\frac{n_2}{2}} t^{\frac{n_1}{2}-1} (n_1t+n_2)^{-\frac{n_1+n_2}{2}} \\ &\quad\,=\quad\, \frac{\Gamma[(n_1+n_2)/2]}{\Gamma(n_1/2)\Gamma(n_2/2)}(\frac{n_1}{n_2})^{\frac{n_1}{2}} t^{\frac{n_1}{2}-1} (1+\frac{n_1}{n_2}t)^{-\frac{n_1+n_2}{2}} \thinspace。 \end{aligned}
pF(t)=∫−∞+∞p(ty,y)∣y∣dy=∫−∞+∞pX(ty)pY(y)∣y∣dy=∫0+∞pX(ty)pY(y)ydy=∫0+∞2n1/2Γ(n1/2)1n12n1e−2n1ty(ty)2n1−1⋅2n2/2Γ(n2/2)1n22n2e−2n2yy2n2−1⋅ydy=2(n1+n2)/2Γ(n1/2)Γ(n2/2)1n12n1n22n2t2n1−1∫0+∞e−2n1t+n2yy2n1+n2−1dy=y=n1t+n22z2(n1+n2)/2Γ(n1/2)Γ(n2/2)1n12n1n22n2t2n1−1⋅(n1t+n22)2n1+n2∫0+∞e−zz2n1+n2−1dz=Γ(n1/2)Γ(n2/2)Γ[(n1+n2)/2]n12n1n22n2t2n1−1(n1t+n2)−2n1+n2=Γ(n1/2)Γ(n2/2)Γ[(n1+n2)/2](n2n1)2n1t2n1−1(1+n2n1t)−2n1+n2。综上,我们得到
p
F
(
t
)
=
{
Γ
[
(
n
1
+
n
2
)
/
2
]
Γ
(
n
1
/
2
)
Γ
(
n
2
/
2
)
(
n
1
n
2
)
n
1
2
t
n
1
2
−
1
(
1
+
n
1
n
2
t
)
−
n
1
+
n
2
2
,
t
>
0
0
,
t
⩽
0
。
p_{F}(t) = \left\{\begin{array}{cc} \frac{\Gamma[(n_1+n_2)/2]}{\Gamma(n_1/2)\Gamma(n_2/2)}(\frac{n_1}{n_2})^{\frac{n_1}{2}} t^{\frac{n_1}{2}-1} (1+\frac{n_1}{n_2}t)^{-\frac{n_1+n_2}{2}}, & t>0 \\ 0, & t\leqslant 0 \end{array}\right. \thinspace。
pF(t)={Γ(n1/2)Γ(n2/2)Γ[(n1+n2)/2](n2n1)2n1t2n1−1(1+n2n1t)−2n1+n2,0,t>0t⩽0。