第二章 抽样分布及若干预备知识(3)
1. Γ \Gamma Γ分布与 B \Beta B分布
在了解 Γ \Gamma Γ分布与 B \Beta B分布之前,要先知道 Γ \Gamma Γ函数和 B \Beta B函数。
Γ \Gamma Γ函数:定义为 Γ ( x ) = ∫ 0 ∞ t x − 1 e − t d t ⋅ I ( x > 0 ) \Gamma(x)=\int_0^\infty t^{x-1}e^{-t}dt \cdot I_{(x>0)} Γ(x)=∫0∞tx−1e−tdt⋅I(x>0)。
- 其主要取值为 Γ ( 1 ) = ∫ 0 ∞ e − t d t = 1 , Γ ( 1 2 ) = ∫ 0 ∞ t − 1 / 2 e − t d t = π \Gamma(1)=\int_0^\infty e^{-t}dt=1,\Gamma(\frac12)=\int_0^\infty t^{-1/2}e^{-t}dt=\sqrt \pi Γ(1)=∫0∞e−tdt=1,Γ(21)=∫0∞t−1/2e−tdt=π。
- 余元公式:对于 0 < s < 1 0<s<1 0<s<1,有 Γ ( s ) Γ ( 1 − s ) = π sin π s \Gamma(s)\Gamma(1-s)=\frac{\pi}{\sin{\pi s}} Γ(s)Γ(1−s)=sinπsπ,利用此公式得到 Γ ( 1 2 ) \Gamma(\frac12) Γ(21)的值。
- 递归公式: Γ ( x + 1 ) = x Γ ( x ) \Gamma(x+1)=x\Gamma(x) Γ(x+1)=xΓ(x),所以 Γ \Gamma Γ函数可以看成阶乘在实数域上的延拓。
B \Beta B函数:定义为 B ( a , b ) = ∫ 0 1 x a − 1 ( 1 − x ) b − 1 d x , a > 0 , b > 0 \Beta(a,b)=\int_0^1 x^{a-1}(1-x)^{b-1}dx,a>0,b>0 B(a,b)=∫01xa−1(1−x)b−1dx,a>0,b>0。
- 可以证明 B ( a , b ) = B ( b , a ) \Beta(a,b)=\Beta(b,a) B(a,b)=B(b,a)。
- B ( a , b ) = Γ ( a ) Γ ( b ) Γ ( a + b ) \Beta(a,b)=\frac{\Gamma(a)\Gamma(b)}{\Gamma(a+b)} B(a,b)=Γ(a+b)Γ(a)Γ(b),如果 a , b a,b a,b都是正整数,则有 B ( a , b ) = 1 C a + b − 2 a − 1 \Beta(a,b)=\frac{1}{C_{a+b-2}^{a-1}} B(a,b)=Ca+b−2a−11。由于已知 B \Beta B函数值总是落在0、1之间,所以 Γ ( a + b ) \Gamma(a+b) Γ(a+b)要在分母的位置。
现在可以给出 Γ \Gamma Γ分布与 B \Beta B分布。
Γ \Gamma Γ分布:概率密度为 Γ ( x ; α , λ ) = λ α Γ ( α ) x α − 1 e − λ x I ( x > 0 ) \Gamma(x;\alpha,\lambda)=\frac{\lambda^\alpha}{\Gamma(\alpha)}x^{\alpha-1}e^{-\lambda x}I_{(x>0)} Γ(x;α,λ)=Γ(α)λαxα−1e−λxI(x>0),其决定式为 x α − 1 e − λ x x^{\alpha-1}e^{-\lambda x} xα−1e−λx。
-
利用 Γ \Gamma Γ函数可以给出其正则化因子。
∫ 0 ∞ x α − 1 e − λ x d x = 1 λ α − 1 ∫ 0 ∞ ( λ x ) α − 1 e − λ x d x = 1 λ α ∫ 0 ∞ ( λ x ) α − 1 e − λ x d ( λ x ) = Γ ( α ) λ α \begin{aligned} &\int_0^\infty x^{\alpha-1}e^{-\lambda x}dx\\ =&\frac1{\lambda^{\alpha-1}}\int_0^\infty (\lambda x)^{\alpha-1}e^{-\lambda x} dx\\ =&\frac1{\lambda^\alpha} \int_0^\infty(\lambda x)^{\alpha-1}e^{-\lambda x}d(\lambda x)\\ =&\frac{\Gamma(\alpha)}{\lambda^\alpha} \end{aligned} ===∫0∞xα−1e−λxdxλα−11∫0∞(λx)α−1e−λxdxλα1∫0∞(λx)α−1e−λxd(λx)λαΓ(α)
其正则化因子可以帮助我们很快地找到期望与方差。 -
可以验证 Γ \Gamma Γ分布的可加性与可乘性,即 X 1 ∼ Γ ( α 1 , λ ) , X 2 ∼ Γ ( α 2 , λ ) X_1\sim \Gamma(\alpha_1,\lambda),X_2\sim \Gamma(\alpha_2,\lambda) X1∼Γ(α1,λ),X2∼Γ(α2,λ)且独立,则 X 1 + X 2 ∼ Γ ( α 1 + α 2 , λ ) X_1+X_2\sim \Gamma(\alpha_1+\alpha_2,\lambda) X1+X2∼Γ(α1+α2,λ);若 X ∼ Γ ( α , λ ) X\sim \Gamma(\alpha,\lambda) X∼Γ(α,λ),则 k X ∼ Γ ( α , λ / k ) kX\sim \Gamma(\alpha,\lambda/k) kX∼Γ(α,λ/k)。
-
Γ \Gamma Γ分布的期望为 E X = α / λ EX=\alpha/\lambda EX=α/λ,方差为 α / λ 2 \alpha/\lambda^2 α/λ2。
B \Beta B分布:概率密度为 B ( x ; a , b ) = 1 B ( a , b ) x a − 1 ( 1 − x ) b − 1 I ( 0 < x < 1 ) \Beta(x;a,b)=\frac1{\Beta(a,b)}x^{a-1}(1-x)^{b-1}I_{(0<x<1)} B(x;a,b)=B(a,b)1xa−1(1−x)b−1I(0<x<1),其决定式为 x a − 1 ( 1 − x ) b − 1 x^{a-1}(1-x)^{b-1} xa−1(1−x)b−1。
-
B \Beta B分布的正则化因子是显然的。
-
根据 B \Beta B函数与 Γ \Gamma Γ函数的关系,可以得到期望与方差,分别为
X ∼ B ( a , b ) , E X = a a + b , D X = a b ( a + b ) 2 ( a + b + 1 ) X\sim \Beta(a,b),EX=\frac a {a+b},DX=\frac{ab}{(a+b)^2(a+b+1)} X∼B(a,b),EX=a+ba,DX=(a+b)2(a+b+1)ab
2. χ 2 \chi^2 χ2分布
χ 2 \chi^2 χ2分布:设 X 1 , X 2 , ⋯ , X n i.i.d. ∼ N ( 0 , 1 ) X_1,X_2,\cdots,X_n\text{i.i.d.}\sim N(0,1) X1,X2,⋯,Xni.i.d.∼N(0,1),则 ξ = ∑ i = 1 n X i 2 \xi=\sum_{i=1}^n X_i^2 ξ=∑i=1nXi2被称为自由度为 n n n的 χ 2 \chi^2 χ2变量,其分布称为自由度为 n n n的 χ 2 \chi^2 χ2分布,记作 ξ ∼ χ n 2 \xi\sim \chi^2_n ξ∼χn2。也就是说, n n n个独立的标准正态变量平方和构成自由度为 n n n的 χ 2 \chi^2 χ2变量。
χ
2
\chi^2
χ2分布的概率密度函数如下:
g
n
(
x
)
=
{
1
2
n
/
2
Γ
(
n
/
2
)
x
n
/
2
−
1
e
−
x
/
2
,
x
>
0
0
,
x
≤
0
g_n(x)=\left\{ \begin{array}{l} \frac{1}{2^{n/2}\Gamma(n/2)}x^{n/2-1}e^{-x/2},&x>0\\0,&x\le0 \end{array} \right.
gn(x)={2n/2Γ(n/2)1xn/2−1e−x/2,0,x>0x≤0
去掉正则化因子,得到
χ
2
\chi^2
χ2分布的决定式为
g
n
(
x
)
∝
x
n
/
2
−
1
e
−
x
/
2
I
(
x
>
0
)
g_n(x)\propto x^{n/2-1}e^{-x/2}I_{(x>0)}
gn(x)∝xn/2−1e−x/2I(x>0)。要证明其概率密度函数的形式需要用到球坐标变换。
与 Γ \Gamma Γ分布对比,可以发现实际上 χ n 2 \chi^2_n χn2的分布等同于 Γ ( n 2 , 1 2 ) \Gamma(\frac{n}2,\frac12) Γ(2n,21)。如果给定 X ∼ Γ ( α , λ ) X\sim \Gamma (\alpha, \lambda ) X∼Γ(α,λ),则 2 λ X ∼ Γ ( α , 1 / 2 ) = χ 2 α 2 2\lambda X\sim \Gamma(\alpha,1/2)= \chi^2_{2\alpha} 2λX∼Γ(α,1/2)=χ2α2,这就是 Γ \Gamma Γ分布与 χ 2 \chi^2 χ2分布的互相转化。
接下来求 χ 2 \chi^2 χ2变量的一些性质。
-
ξ ∼ χ n 2 \xi\sim \chi^2_n ξ∼χn2,则其特征函数为 φ ( t ) = ( 1 − 2 i t ) − n / 2 \varphi(t)=(1-2it)^{-n/2} φ(t)=(1−2it)−n/2。要证明这个结论,可以先找 Γ ( α , λ ) \Gamma(\alpha, \lambda) Γ(α,λ)的特征函数,设 X ∼ Γ ( α , λ ) X\sim \Gamma(\alpha, \lambda) X∼Γ(α,λ),则有
E ( e i t X ) = λ α Γ ( α ) ∫ 0 ∞ x α − 1 e − λ x e i t x d x = ( λ λ − i t ) α E(e^{itX})=\frac{\lambda^\alpha}{\Gamma(\alpha)}\int_0^\infty x^{\alpha-1}e^{-\lambda x}e^{itx}dx=(\frac{\lambda}{\lambda-it})^\alpha E(eitX)=Γ(α)λα∫0∞xα−1e−λxeitxdx=(λ−itλ)α
而 ξ ∼ χ n 2 = Γ ( n / 2 , 1 / 2 ) \xi\sim \chi^2_n=\Gamma(n/2,1/2) ξ∼χn2=Γ(n/2,1/2),代入数据得
φ ( t ) = ( 1 / 2 1 / 2 − i t ) n / 2 = ( 1 − 2 i t ) n / 2 \varphi(t)=(\frac{1/2}{1/2-it})^{n/2}=(1-2it)^{n/2} φ(t)=(1/2−it1/2)n/2=(1−2it)n/2 -
ξ ∼ χ n 2 \xi\sim \chi^2_n ξ∼χn2,则 E ξ = n , D ξ = 2 n E\xi=n,D\xi=2n Eξ=n,Dξ=2n。有了 Γ \Gamma Γ分布的期望与方差就可以代入求。
-
可加性: Z 1 ∼ χ n 1 2 , Z 2 ∼ χ n 2 2 Z_1\sim \chi_{n_1}^2,Z_2\sim \chi_{n_2}^2 Z1∼χn12,Z2∼χn22,则 Z 1 + Z 2 ∼ χ n 1 + n 2 2 Z_1+Z_2\sim \chi^2_{n_1+n_2} Z1+Z2∼χn1+n22。这既可以用特征函数,也可以用 Γ \Gamma Γ分布的可加性,还可以用 χ 2 \chi^2 χ2变量的定义来证明。
3. t t t分布
t t t分布:设有两个相互独立的随机变量 X ∼ N ( 0 , 1 ) , Y ∼ χ n 2 X\sim N(0,1),Y\sim \chi^2_n X∼N(0,1),Y∼χn2,则 T = X Y / n T=\frac{X}{\sqrt{Y/n}} T=Y/nX称为自由度为 n n n的 t t t变量,其分布为自由度为 n n n的 t t t分布,记作 T ∼ t n T\sim t_n T∼tn。形式上, t t t分布表现为正态分布除以归一化的卡方分布。
t t t分布的概率密度函数为 t n ( x ) = Γ ( n + 1 2 ) Γ ( n 2 ) n π ( 1 + x 2 n ) − ( n + 1 ) / 2 t_n(x)=\frac{\Gamma(\frac{n+1}{2})}{\Gamma(\frac n2)\sqrt{n\pi}}(1+\frac{x^2}{n})^{-(n+1)/2} tn(x)=Γ(2n)nπΓ(2n+1)(1+nx2)−(n+1)/2。其证明用到以下两个引理:
- 设 X X X是一维连续随机变量,概率密度为 f X ( x ) f_X(x) fX(x),则 Y = a X + b Y=aX+b Y=aX+b的概率密度为 f Y ( y ) = 1 ∣ a ∣ f X ( y − b a ) f_Y(y)=\frac{1}{|a|}f_X(\frac{y-b}{a}) fY(y)=∣a∣1fX(ay−b)。
- 设 ( X , Y ) (X,Y) (X,Y)是二维连续随机变量,概率密度为 f ( x , y ) f(x,y) f(x,y),则 Z = Y / X Z=Y/X Z=Y/X的概率密度为 f z ( z ) = ∫ − ∞ ∞ ∣ x ∣ f ( x , x z ) d x f_z(z)=\int_{-\infty}^\infty |x|f(x,xz)dx fz(z)=∫−∞∞∣x∣f(x,xz)dx。
首先计算
Y
/
n
Y/n
Y/n的概率密度,由引理1,可以得到
f
Y
/
n
(
x
)
=
n
2
n
/
2
Γ
(
n
/
2
)
(
n
x
)
n
/
2
−
1
e
−
n
x
/
2
I
(
x
>
0
)
=
(
n
/
2
)
n
/
2
Γ
(
n
/
2
)
x
n
/
2
−
1
e
−
n
x
/
2
I
(
x
>
0
)
\begin{aligned} &f_{Y/n}(x)\\ =&\frac{n}{2^{n/2}\Gamma(n/2)}(nx)^{n/2-1}e^{-nx/2}I_{(x>0)}\\ =&\frac{(n/2)^{n/2}}{\Gamma(n/2)}x^{n/2-1}e^{-nx/2}I_{(x>0)} \end{aligned}
==fY/n(x)2n/2Γ(n/2)n(nx)n/2−1e−nx/2I(x>0)Γ(n/2)(n/2)n/2xn/2−1e−nx/2I(x>0)
接下来计算
Y
/
n
\sqrt{Y/n}
Y/n的概率密度,首先有
F
(
Y
/
n
)
(
y
)
=
P
{
Y
/
n
≤
y
}
=
P
{
Y
/
n
≤
y
2
}
=
F
Y
/
n
(
y
2
)
F_{\sqrt{(Y/n)}}(y)=P\{\sqrt{Y/n}\leq y\}=P\{Y/n\leq y^2\}=F_{Y/n}(y^2)
F(Y/n)(y)=P{Y/n≤y}=P{Y/n≤y2}=FY/n(y2)
对等式两边同时求导,得
f
(
Y
/
n
)
(
y
)
=
2
y
f
Y
/
n
(
y
2
)
=
2
y
(
n
/
2
)
n
/
2
Γ
(
n
/
2
)
(
y
2
)
n
/
2
−
1
e
−
n
y
2
/
2
I
(
y
>
0
)
=
2
(
n
/
2
)
n
/
2
Γ
(
n
/
2
)
y
n
−
1
e
−
n
y
2
/
2
I
(
y
>
0
)
\begin{aligned} &f_{\sqrt{(Y/n)}}(y)=2yf_{Y/n}(y^2)\\ =&\frac{2y(n/2)^{n/2}}{\Gamma(n/2)}(y^2)^{n/2-1}e^{-ny^2/2}I_{(y>0)}\\ =&\frac{2(n/2)^{n/2}}{\Gamma(n/2)}y^{n-1}e^{-ny^2/2}I_{(y>0)} \end{aligned}
==f(Y/n)(y)=2yfY/n(y2)Γ(n/2)2y(n/2)n/2(y2)n/2−1e−ny2/2I(y>0)Γ(n/2)2(n/2)n/2yn−1e−ny2/2I(y>0)
接下来求
X
Y
/
n
\frac{X}{\sqrt{Y/n}}
Y/nX的分布,由于
X
,
Y
X,Y
X,Y独立,所以联合分布为边际分布之乘积,于是
f
T
(
z
)
=
∫
−
∞
∞
∣
x
∣
f
(
x
,
x
z
)
d
x
=
∫
−
∞
∞
∣
x
∣
2
(
n
/
2
)
n
/
2
Γ
(
n
/
2
)
x
n
−
1
e
−
n
x
2
/
2
I
(
x
>
0
)
1
2
π
exp
{
−
(
x
z
)
2
2
}
d
x
=
∫
0
∞
2
(
n
/
2
)
n
/
2
π
Γ
(
n
/
2
)
x
n
e
−
x
2
2
(
n
+
z
2
)
d
x
\begin{aligned} f_T(z)=&\int_{-\infty}^\infty |x|f(x, xz)dx\\ =&\int_{-\infty}^\infty|x|\frac{2(n/2)^{n/2}}{\Gamma(n/2)}x^{n-1}e^{-nx^2/2}I_{(x>0)}\frac{1}{\sqrt{2\pi}}\text{exp}\left\{-\frac{(xz)^2}{2}\right\}dx\\ =&\int_0^\infty \frac{\sqrt2(n/2)^{n/2}}{\sqrt{\pi}\Gamma(n/2)}x^ne^{-\frac{x^2}{2}(n+z^2)}dx \end{aligned}
fT(z)===∫−∞∞∣x∣f(x,xz)dx∫−∞∞∣x∣Γ(n/2)2(n/2)n/2xn−1e−nx2/2I(x>0)2π1exp{−2(xz)2}dx∫0∞πΓ(n/2)2(n/2)n/2xne−2x2(n+z2)dx
整理成这个形式以后,要想办法向
Γ
\Gamma
Γ函数靠近,所以令
u
=
x
2
2
(
n
+
z
2
)
u=\frac{x^2}{2}(n+z^2)
u=2x2(n+z2),就有
x
=
2
u
n
+
z
2
,
d
x
=
1
2
u
(
n
+
z
2
)
d
u
x=\sqrt{\frac{2u}{n+z^2}},dx=\frac{1}{\sqrt {2u(n+z^2)}}du
x=n+z22u,dx=2u(n+z2)1du,代入可得
f
T
(
z
)
=
∫
0
∞
2
(
n
/
2
)
n
/
2
π
Γ
(
n
/
2
)
2
u
n
+
z
2
n
e
−
u
1
2
u
(
n
+
z
2
)
d
u
=
∫
0
∞
2
n
(
n
/
2
)
n
/
2
π
(
n
+
z
2
)
n
+
1
Γ
(
n
/
2
)
u
(
n
−
1
)
/
2
e
−
u
d
u
=
Γ
(
n
+
1
2
)
n
π
Γ
(
n
2
)
(
1
+
z
2
n
)
−
n
+
1
2
\begin{aligned} f_T(z)=&\int_0^\infty\frac{\sqrt 2(n/2)^{n/2}}{\sqrt \pi \Gamma(n/2)}\sqrt{\frac{2u}{n+z^2}}^ne^{-u}\frac{1}{\sqrt{2u(n+z^2)}}du\\ =&\int_0^\infty \frac{\sqrt{2^n}(n/2)^{n/2}}{\sqrt {\pi(n+z^2)^{n+1}\Gamma(n/2)}}u^{(n-1)/2}e^{-u}du\\ =&\frac{\Gamma(\frac{n+1}{2})}{\sqrt{n\pi}\Gamma(\frac{n}{2})}\left(1+\frac{z^2}{n}\right)^{-\frac{n+1}{2}} \end{aligned}
fT(z)===∫0∞πΓ(n/2)2(n/2)n/2n+z22une−u2u(n+z2)1du∫0∞π(n+z2)n+1Γ(n/2)2n(n/2)n/2u(n−1)/2e−udunπΓ(2n)Γ(2n+1)(1+nz2)−2n+1
这就得到
t
t
t分布的概率密度函数。总结以上过程,第一步先求得
Y
/
n
Y/n
Y/n的分布,然后求
Y
/
n
\sqrt{Y/n}
Y/n的分布,最后求
X
/
Y
/
n
X/\sqrt{Y/n}
X/Y/n的分布,过程中用到一些变换引理。
t t t分布的一些性质:
- 若 T ∼ t n T\sim t_n T∼tn,则 E ( T r ) E(T^r) E(Tr)只有在 r < n ( n > 1 ) r<n(n>1) r<n(n>1)时存在(严格小于),而 n ≥ 2 n\geq2 n≥2时 E ( T ) = 0 E(T)=0 E(T)=0, n ≥ 3 n\geq3 n≥3时 D ( T ) = n / ( n − 2 ) D(T)=n/(n-2) D(T)=n/(n−2)。
- 自由度为1的 t t t分布就是柯西分布,柯西分布不存在均值。
- n → ∞ n\to\infty n→∞时 t t t变量的极限分布是正态分布。
4. F F F分布
F F F分布:对于两个独立的 χ 2 \chi^2 χ2变量 X ∼ X m 2 , Y ∼ X n 2 X\sim X_m^2,Y\sim X_n^2 X∼Xm2,Y∼Xn2,称 F = X / m Y / n F=\frac{X/m}{Y/n} F=Y/nX/m是自由度为 m , n m,n m,n的 F F F变量,服从自由度为 m , n m,n m,n的 F F F分布,记作 F ∼ F m , n F\sim F_{m,n} F∼Fm,n。注意分子的自由度在前。
F F F分布的密度函数为 f m , n ( x ) = Γ ( m + n 2 ) Γ ( n 2 ) Γ ( m 2 ) m m / 2 n n / 2 x m / 2 − 1 ( n + m x ) − ( m + n ) / 2 f_{m,n}(x)=\frac{\Gamma(\frac{m+n}{2})}{\Gamma(\frac n2)\Gamma(\frac m2)}m^{m/2}n^{n/2}x^{m/2-1}(n+mx)^{-(m+n)/2} fm,n(x)=Γ(2n)Γ(2m)Γ(2m+n)mm/2nn/2xm/2−1(n+mx)−(m+n)/2。
F F F分布的一些性质:
- 若 Z ∼ F m , n Z\sim F_{m,n} Z∼Fm,n,则 1 / Z ∼ F n , m 1/Z\sim F_{n,m} 1/Z∼Fn,m。
- 若 T ∼ t n T~\sim t_n T ∼tn,则 T 2 ∼ F 1 , n T^2\sim F_{1,n} T2∼F1,n。
- 若 Z ∼ F m , n Z\sim F_{m,n} Z∼Fm,n,则 E Z = n / ( n − 2 ) , n > 2 ; D Z = 2 n 2 ( m + n − 2 ) / m ( n − 2 ) 2 ( n − 4 ) , n > 4 EZ=n/(n-2),n>2;DZ=2n^2(m+n-2)/m(n-2)^2(n-4),n>4 EZ=n/(n−2),n>2;DZ=2n2(m+n−2)/m(n−2)2(n−4),n>4。
- 记 F m , n ( α ) F_{m,n}(\alpha) Fm,n(α)为其上 α \alpha α分位数。 F m , n ( 1 − α ) = 1 / F n , m ( α ) F_{m,n}(1-\alpha)=1/F_{n,m}(\alpha) Fm,n(1−α)=1/Fn,m(α)。有了这个性质,我们可以对 α = 0.95 , 0.99 \alpha=0.95,0.99 α=0.95,0.99之类的值进行分位数求值。
关于三大分布,最主要的应用在于它们的定义式,以及用作区间估计、假设检验中查分位数表,均值、方差等数字特征并不常用,概率密度函数也并不很重要。
5.一些推论
对于一系列正态变量
X
1
,
⋯
,
X
n
X_1,\cdots,X_n
X1,⋯,Xn,其中
X
i
∼
N
(
a
i
,
σ
i
2
)
X_i\sim N(a_i,\sigma_i^2)
Xi∼N(ai,σi2),有
∑
i
=
1
n
(
X
i
−
a
i
σ
i
)
2
∼
χ
n
2
\sum_{i=1}^n\left(\frac{X_i-a_i}{\sigma_i}\right)^2\sim\chi_n^2
i=1∑n(σiXi−ai)2∼χn2
这是联系正态变量与卡方变量的直接方式。
若
X
1
,
⋯
,
X
n
i.i.d
∼
N
(
a
,
σ
2
)
X_1,\cdots,X_n\text{i.i.d}\sim N(a,\sigma^2)
X1,⋯,Xni.i.d∼N(a,σ2),则
T
=
n
(
X
ˉ
−
a
)
S
∼
t
n
−
1
T=\frac{\sqrt n(\bar X-a)}{S}\sim t_{n-1}
T=Sn(Xˉ−a)∼tn−1
证明如下,因为
X
ˉ
∼
N
(
a
,
σ
/
n
)
\bar X\sim N(a,\sigma/n)
Xˉ∼N(a,σ/n),所以将其标准化后,有
N
1
=
X
ˉ
−
a
σ
/
n
∼
N
(
0
,
1
)
N_1=\frac{\bar X-a}{\sigma/\sqrt n}\sim N(0,1)
N1=σ/nXˉ−a∼N(0,1)
而
N
2
=
(
n
−
1
)
S
2
/
σ
2
∼
χ
n
−
1
2
N_2=(n-1)S^2/\sigma^2\sim \chi^2_{n-1}
N2=(n−1)S2/σ2∼χn−12,所以
N
1
N
2
/
(
n
−
1
)
=
n
(
X
ˉ
−
a
)
σ
⋅
σ
2
S
2
=
n
(
X
ˉ
−
a
)
S
∼
t
n
−
1
\frac{N_1}{\sqrt{N_2/(n-1)}}=\frac{\sqrt{n}(\bar X-a)}{\sigma}\cdot \sqrt{\frac{\sigma^2}{S^2}}=\frac{\sqrt{n}(\bar X-a)}{S}\sim t_{n-1}
N2/(n−1)N1=σn(Xˉ−a)⋅S2σ2=Sn(Xˉ−a)∼tn−1
这常用于一组样本在未知方差情形下的均值检验。
设
X
1
,
⋯
,
X
m
i.i.d.
∼
N
(
a
1
,
σ
2
)
,
Y
1
,
⋯
,
Y
n
i.i.d.
∼
N
(
a
2
,
σ
2
)
X_1,\cdots,X_m\text{i.i.d.}\sim N(a_1,\sigma^2),Y_1,\cdots,Y_n\text{i.i.d.}\sim N(a_2,\sigma^2)
X1,⋯,Xmi.i.d.∼N(a1,σ2),Y1,⋯,Yni.i.d.∼N(a2,σ2),且两组样本独立,则有
T
=
(
X
ˉ
−
Y
ˉ
)
−
(
a
1
−
a
2
)
S
w
⋅
m
n
m
+
n
∼
t
m
+
n
−
2
其
中
S
w
2
=
1
m
+
n
−
2
[
∑
i
=
1
m
(
X
i
−
X
ˉ
)
2
+
∑
j
=
1
n
(
Y
i
−
Y
ˉ
)
2
]
T=\frac{(\bar X-\bar Y)-(a_1-a_2)}{S_w}\cdot\sqrt{\frac{mn}{m+n}}\sim t_{m+n-2}\\ 其中S_w^2=\frac{1}{m+n-2}[\sum_{i=1}^m(X_i-\bar X)^2+\sum_{j=1}^n(Y_i-\bar Y)^2]
T=Sw(Xˉ−Yˉ)−(a1−a2)⋅m+nmn∼tm+n−2其中Sw2=m+n−21[i=1∑m(Xi−Xˉ)2+j=1∑n(Yi−Yˉ)2]
证明如下,由于
X
ˉ
∼
N
(
a
1
,
σ
2
/
m
)
,
Y
ˉ
∼
N
(
a
2
,
σ
2
/
n
)
\bar X\sim N(a_1,\sigma^2/m),\bar Y\sim N(a_2,\sigma^2/n)
Xˉ∼N(a1,σ2/m),Yˉ∼N(a2,σ2/n),所以
X
ˉ
−
Y
ˉ
∼
N
(
a
1
−
a
2
,
(
σ
m
+
n
m
n
)
2
)
N
1
=
(
X
ˉ
−
Y
ˉ
)
−
(
a
1
−
a
2
)
σ
m
+
n
m
n
∼
N
(
0
,
1
)
\bar X-\bar Y\sim N\left(a_1-a_2,\left(\sigma\sqrt{\frac{m+n}{mn}}\right)^2\right)\\ N_1=\frac{(\bar X-\bar Y)-(a_1-a_2)}{\sigma\sqrt{\frac{m+n}{mn}}}\sim N(0,1)
Xˉ−Yˉ∼N⎝⎛a1−a2,(σmnm+n)2⎠⎞N1=σmnm+n(Xˉ−Yˉ)−(a1−a2)∼N(0,1)
而
(
m
+
n
−
2
)
S
w
2
=
(
m
−
1
)
S
X
2
+
(
n
−
1
)
S
Y
2
(m+n-2)S_w^2=(m-1)S_X^2+(n-1)S_Y^2
(m+n−2)Sw2=(m−1)SX2+(n−1)SY2,由于
χ
2
\chi^2
χ2分布的可加性,有
N
2
=
(
m
+
n
−
2
)
S
w
2
σ
2
∼
χ
m
+
n
−
2
2
N_2=\frac{(m+n-2)S_w^2}{\sigma^2}\sim \chi^2_{m+n-2}
N2=σ2(m+n−2)Sw2∼χm+n−22
所以
N
1
N
2
/
(
m
+
n
−
2
)
=
(
X
ˉ
−
Y
ˉ
)
−
(
a
1
−
a
2
)
σ
m
+
n
m
n
⋅
σ
S
w
=
T
∼
t
m
+
n
−
2
\frac{N_1}{\sqrt{N_2/(m+n-2)}}=\frac{(\bar X-\bar Y)-(a_1-a_2)}{\sigma\sqrt{\frac{m+n}{mn}}}\cdot \frac{\sigma}{S_w}=T\sim t_{m+n-2}
N2/(m+n−2)N1=σmnm+n(Xˉ−Yˉ)−(a1−a2)⋅Swσ=T∼tm+n−2
这常用于两组样本在方差相等但未知的情况下估计均值差异。
设
X
1
,
⋯
,
X
m
i.i.d.
∼
N
(
a
1
,
σ
1
2
)
,
Y
1
,
⋯
,
Y
n
i.i.d.
∼
N
(
a
2
,
σ
2
2
)
X_1,\cdots,X_m\text{i.i.d.}\sim N(a_1,\sigma^2_1),Y_1,\cdots,Y_n\text{i.i.d.}\sim N(a_2,\sigma^2_2)
X1,⋯,Xmi.i.d.∼N(a1,σ12),Y1,⋯,Yni.i.d.∼N(a2,σ22),且两组样本相互独立,则
F
=
S
1
2
/
σ
1
2
S
2
2
/
σ
2
2
∼
F
m
−
1
,
n
−
1
F=\frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2}\sim F_{m-1,n-1}
F=S22/σ22S12/σ12∼Fm−1,n−1
适用于检验两个正态样本方差比值的检测。
设
X
1
,
⋯
,
X
n
i.i.d.
∼
f
(
x
,
λ
)
=
λ
e
λ
x
I
(
0
,
∞
)
(
x
)
X_1,\cdots,X_n\text{i.i.d.}\sim f(x,\lambda )=\lambda e^{\lambda x}I_{(0,\infty)}(x)
X1,⋯,Xni.i.d.∼f(x,λ)=λeλxI(0,∞)(x),则有
2
λ
n
X
ˉ
=
2
λ
∑
i
=
1
n
∼
χ
2
n
2
2\lambda n \bar X=2\lambda \sum_{i=1}^n\sim \chi^2_{2n}
2λnXˉ=2λi=1∑n∼χ2n2
只要注意到
Γ
(
n
,
λ
)
\Gamma(n,\lambda)
Γ(n,λ)是
n
n
n个同分布指数分布
E
(
λ
)
E(\lambda)
E(λ)的和即可,即
∑
i
=
1
n
X
i
=
ξ
∼
Γ
(
n
,
λ
)
\sum_{i=1}^n X_i=\xi\sim \Gamma(n,\lambda)
∑i=1nXi=ξ∼Γ(n,λ)即可。