一、基本概念
在统计中,我们把需要用样本去推断“正确”与否的命题称为一个假设。当然,假设是可以关于参数的,也可以是关于分布的。
通过样本对一个假设作出“对”或“不对”的具体判断规则就称为该假设的一个检验。检验的结果若“是”,则否定该命题,就称拒绝该假设,否则就称为接受原假设。这里的拒绝和接受原假设,只是在当前样本下作出的判断,并没有从逻辑或理论上“证明”该命题正确与否。
设有样本
X
X
X,取值于样本空间
X
\mathcal X
X,且知道样本来自某一个参数分布族
{
F
(
x
,
θ
)
:
θ
∈
Θ
}
\{F(x,\theta): \theta\in\Theta\}
{F(x,θ):θ∈Θ},其中
Θ
\Theta
Θ为参数空间。设
Θ
0
⊂
Θ
\Theta_0\subset\Theta
Θ0⊂Θ,且
Θ
0
≠
∅
\Theta_0\ne\varnothing
Θ0=∅,则命题
H
0
:
θ
∈
Θ
0
H_0:\theta\in\Theta_0
H0:θ∈Θ0称为一个假设或零假设。如记
Θ
1
=
Θ
−
Θ
0
\Theta_1=\Theta-\Theta_0
Θ1=Θ−Θ0,则命题
H
1
:
θ
∈
Θ
1
H_1:\theta\in\Theta_1
H1:θ∈Θ1称为
H
0
H_0
H0的备择假设。于是
H
0
:
θ
∈
Θ
0
↔
H
1
:
θ
∈
Θ
1
(1)
H_0:\theta\in\Theta_0\leftrightarrow H_1:\theta\in\Theta_1\tag1
H0:θ∈Θ0↔H1:θ∈Θ1(1)
称为假设检验问题。
对于上述假设的检验就是指这样一个法则或策略:当有了具体的样本后,由该法则或策略就可决定是接受 H 0 H_0 H0还是拒绝 H 0 H_0 H0,即检验就等价于把样本空间 X \mathcal X X划分成两个互不相交的部分 W W W和 W ‾ \overline W W,当样本属于 W ‾ \overline W W时,接受 H 0 H_0 H0;否则拒绝 H 0 H_0 H0。于是,我们称 W W W为该检验的拒绝域,而 W ‾ \overline W W称为接受域
由于样本是随机的,所以我们有可能会做出错误的决策,即当 θ ∈ Θ 0 \theta\in\Theta_0 θ∈Θ0时,样本却落入了拒绝域 W W W,于是采取了拒绝 H 0 H_0 H0的错误决策,称这样的错误为第一类错误;当 θ ∈ Θ 1 \theta\in\Theta_1 θ∈Θ1时,样本却落入了接受域 W ‾ \overline W W,于是采取了接受 H 0 H_0 H0的错误决策,称这样的错误为第二类错误。具体可见下表:
决策 | H 0 H_0 H0为真 | H 1 H_1 H1为真 |
---|---|---|
接受 H 0 H_0 H0 | 正确 | 第二类错误 |
拒绝 H 0 H_0 H0 | 第一类错误 | 正确 |
- 定义犯第一类错误的概率为 α = P { X ∈ W ∣ H 0 } \alpha=P\{\bm X\in W|H_0\} α=P{X∈W∣H0}
- 定义犯第二类错误的概率为 β = P { X ∈ W ‾ ∣ H 1 } \beta=P\{\bm X\in\overline W|H_1\} β=P{X∈W∣H1}
- 对于固定的样本容量,找不到一个检验方法,使得犯第一、二类错误的概率均达到最小
势函数:对于假设
(
1
)
(1)
(1)的一个检验方法
ψ
\psi
ψ,其拒绝域记作
W
W
W,则称
β
ψ
(
θ
)
=
P
θ
{
X
∈
W
}
,
∀
θ
∈
Θ
(2)
\beta_\psi(\theta)=P_\theta\{\bm X\in W\}, \forall\theta\in\Theta\tag2
βψ(θ)=Pθ{X∈W},∀θ∈Θ(2)
为此检验的势函数。
所以当 θ ∈ Θ 0 \theta\in\Theta_0 θ∈Θ0时,此检验犯第一类错误的概率等于其势函数 β ψ ( θ ) \beta_\psi(\theta) βψ(θ);而当 θ ∈ Θ 1 \theta\in\Theta_1 θ∈Θ1时,检验犯第二类错误的概率等于 1 − β ψ ( θ ) 1-\beta_\psi(\theta) 1−βψ(θ)
显著性水平:对于检验
ψ
\psi
ψ和事先给定的
α
∈
(
0
,
1
)
\alpha\in(0,1)
α∈(0,1),如果它满足
P
θ
{
X
∈
W
}
≤
α
,
∀
θ
∈
Θ
0
(3)
P_\theta\{\bm X\in W\}\le\alpha, \forall \theta\in\Theta_0\tag3
Pθ{X∈W}≤α,∀θ∈Θ0(3)
则称
α
\alpha
α是检验
ψ
\psi
ψ的显著性水平或水平,也称
ψ
\psi
ψ为显著性水平
α
\alpha
α的检验。即检验
ψ
\psi
ψ犯第一类错误的概率不大于
α
\alpha
α.
只控制一个检验犯第一类错误的概率时,称这样的检验为显著性检验。一般情况下,求取某假设的显著性检验的步骤如下:
- 根据实际问题,建立统计假设 H 0 ↔ H 1 H_0\leftrightarrow H_1 H0↔H1
- 选取一个合适的统计量 T ( X ) T(\bm X) T(X),使当 H 0 H_0 H0成立时, T T T的分布已知,且与参数 θ \theta θ无关(称此分布为统计量 T T T的零分布)
- 根据 H 0 H_0 H0及 H 1 H_1 H1的特点,确定拒绝域 W W W的区间形式
- 对于给定的显著性水平 α \alpha α,确定拒绝域 W W W
- 由样本观测值 x \bm x x,计算统计量 T ( X ) T(\bm X) T(X)的值 T ( x ) T(\bm x) T(x),由 T ( x ) T(\bm x) T(x)是否属于 W W W,作出最终判断。
二、单样本正态总体参数的显著性检验
在本节中,始终假设 X 1 , ⋯ , X n X_1,\cdots,X_n X1,⋯,Xn为来自正态总体 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)的 I I D IID IID样本,且我们感兴趣的是关于 μ \mu μ和 σ 2 \sigma^2 σ2的检验问题。
2.1 单样本正态总体均值的检验
方差 | 假设 | 检验统计量 | 拒绝域 | 名字 |
---|---|---|---|---|
σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 | H 0 : μ = μ 0 ↔ H 1 : μ ≠ μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\ne\mu_0 H0:μ=μ0↔H1:μ=μ0 | U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n(X−μ0)/σ0 | { ∣ U ∣ > u α / 2 } \{\mid U\mid\gt u_{\alpha/2}\} {∣U∣>uα/2} | 双侧 u u u检验 |
σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 | H 0 : μ = μ 0 ↔ H 1 : μ < μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\lt\mu_0 H0:μ=μ0↔H1:μ<μ0 | U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n(X−μ0)/σ0 | { U < − u α } \{U\lt -u_{\alpha}\} {U<−uα} | 单侧 u u u检验 |
σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 | H 0 : μ = μ 0 ↔ H 1 : μ > μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\gt\mu_0 H0:μ=μ0↔H1:μ>μ0 | U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n(X−μ0)/σ0 | { U > u α } \{U\gt u_{\alpha}\} {U>uα} | 单侧 u u u检验 |
σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 | H 0 : μ ≤ μ 0 ↔ H 1 : μ > μ 0 H_0:\mu\le\mu_0 \leftrightarrow H_1:\mu\gt\mu_0 H0:μ≤μ0↔H1:μ>μ0 | U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n(X−μ0)/σ0 | { U > u α } \{U\gt u_{\alpha}\} {U>uα} | 单侧 u u u检验 |
σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 | H 0 : μ ≥ μ 0 ↔ H 1 : μ < μ 0 H_0:\mu\ge\mu_0 \leftrightarrow H_1:\mu\lt\mu_0 H0:μ≥μ0↔H1:μ<μ0 | U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n(X−μ0)/σ0 | { U < − u α } \{U\lt -u_{\alpha}\} {U<−uα} | 单侧 u u u检验 |
σ 2 \sigma^2 σ2未知 | H 0 : μ = μ 0 ↔ H 1 : μ ≠ μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\ne\mu_0 H0:μ=μ0↔H1:μ=μ0 | T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n(X−μ0)/Sn | { ∣ T ∣ > t α / 2 ( n − 1 ) } \{\mid T\mid\gt t_{\alpha/2}(n-1)\} {∣T∣>tα/2(n−1)} | 双侧 t t t检验 |
σ 2 \sigma^2 σ2未知 | H 0 : μ = μ 0 ↔ H 1 : μ < μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\lt\mu_0 H0:μ=μ0↔H1:μ<μ0 | T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n(X−μ0)/Sn | { T < − t α ( n − 1 ) } \{T\lt -t_{\alpha}(n-1)\} {T<−tα(n−1)} | 单侧 t t t检验 |
σ 2 \sigma^2 σ2未知 | H 0 : μ = μ 0 ↔ H 1 : μ > μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\gt\mu_0 H0:μ=μ0↔H1:μ>μ0 | T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n(X−μ0)/Sn | { T > t α ( n − 1 ) } \{T\gt t_{\alpha}(n-1)\} {T>tα(n−1)} | 单侧 t t t检验 |
σ 2 \sigma^2 σ2未知 | H 0 : μ ≤ μ 0 ↔ H 1 : μ > μ 0 H_0:\mu\le\mu_0 \leftrightarrow H_1:\mu\gt\mu_0 H0:μ≤μ0↔H1:μ>μ0 | T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n(X−μ0)/Sn | { T > t α ( n − 1 ) } \{T\gt t_{\alpha}(n-1)\} {T>tα(n−1)} | 单侧 t t t检验 |
σ 2 \sigma^2 σ2未知 | H 0 : μ ≥ μ 0 ↔ H 1 : μ < μ 0 H_0:\mu\ge\mu_0 \leftrightarrow H_1:\mu\lt\mu_0 H0:μ≥μ0↔H1:μ<μ0 | T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n(X−μ0)/Sn | { T < − t α ( n − 1 ) } \{T\lt -t_{\alpha}(n-1)\} {T<−tα(n−1)} | 单侧 t t t检验 |
以 σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知时,求检验 H 0 : μ = μ 0 ↔ H 1 : μ ≠ μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\ne\mu_0 H0:μ=μ0↔H1:μ=μ0的拒绝域为例:
由于 X ‾ \overline X X是 μ \mu μ的一个很好的点估计,于是,当 H 0 H_0 H0成立,即 μ = μ 0 \mu=\mu_0 μ=μ0时, X ‾ \overline X X应该与 μ 0 \mu_0 μ0相差不多。而当 μ 1 \mu_1 μ1成立时, X ‾ \overline X X与 μ 0 \mu_0 μ0应相差较大。这样,可以用 ∣ X ‾ − μ 0 ∣ \mid\overline X-\mu_0\mid ∣X−μ0∣的大小来反映假设,并且当 ∣ X ‾ − μ 0 ∣ > c \mid\overline X-\mu_0\mid\gt c ∣X−μ0∣>c时,有理由拒绝 H 0 H_0 H0,即认为 H 1 H_1 H1成立。
因为
V
a
r
(
X
‾
−
μ
0
)
=
σ
2
/
n
Var(\overline X-\mu_0)=\sigma^2/n
Var(X−μ0)=σ2/n,为了标准化,可以取此假设的检验统计量为
U
(
X
)
=
n
(
X
‾
−
μ
0
)
σ
0
(4)
U(\bm X)=\frac{\sqrt n(\overline X-\mu_0)}{\sigma_0}\tag4
U(X)=σ0n(X−μ0)(4)
根据以上分析,此检验的拒绝域为
W
=
{
x
:
∣
U
(
x
)
∣
>
c
}
(5)
W=\{x:\mid U(\bm x)\mid\gt c\}\tag5
W={x:∣U(x)∣>c}(5)
根据显著性水平的特点,上述拒绝域中的常数
c
c
c由事先给定的显著性水平
α
\alpha
α确定,即要求此检验犯第一类错误的概率不大于
α
\alpha
α,也就是说,其常数
c
c
c满足
P
H
0
{
∣
U
(
x
)
∣
>
c
}
≤
α
(6)
P_{H_0}\{\mid U(\bm x)\mid\gt c\}\le \alpha\tag6
PH0{∣U(x)∣>c}≤α(6)
由于当
H
0
H_0
H0成立时,
U
(
X
)
∼
N
(
0
,
1
)
U(\bm X)\sim N(0, 1)
U(X)∼N(0,1),故上述拒绝域中的常数
c
c
c可取
c
=
u
α
/
2
c=u_{\alpha/2}
c=uα/2,又因为此常数是拒绝与接受零假设的分水岭,因此称之为检验的临界值。
总之,关于上述假设的显著性检验总结如下:
- 检验统计量: U ( X ) = n ( X ‾ − μ 0 ) σ 0 (7) U(\bm X)=\frac{\sqrt n(\overline X-\mu_0)}{\sigma_0}\tag7 U(X)=σ0n(X−μ0)(7)
- 检验的拒绝域: { x : ∣ U ( x ) ∣ > u α / 2 } (8) \{\bm x:\mid U(\bm x)\mid\gt u_{\alpha/2}\}\tag8 {x:∣U(x)∣>uα/2}(8)
与置信区间的关系:
对于正态总体 N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2),当 σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知时, μ \mu μ的置信水平为 1 − α 1-\alpha 1−α的置信区间为 [ X ‾ − u α / 2 σ 0 n , X ‾ + u α / 2 σ 0 n ] (9) [\overline X-u_{\alpha/2}\frac{\sigma_0}{n}, \overline X+u_{\alpha/2}\frac{\sigma_0}{n}]\tag9 [X−uα/2nσ0,X+uα/2nσ0](9)
详情见数理统计复习笔记四——区间估计
而根据式 ( 7 ) (7) (7)和式 ( 8 ) (8) (8)可知,检验的拒绝域可化为 { x : μ 0 < X ‾ − u α / 2 σ 0 n 或 μ 0 > X ‾ + u α / 2 σ 0 n } (10) \{\bm x:\mu_0\lt\overline X-u_{\alpha/2}\frac{\sigma_0}{n}或\mu_0\gt\overline X+u_{\alpha/2}\frac{\sigma_0}{n}\}\tag{10} {x:μ0<X−uα/2nσ0或μ0>X+uα/2nσ0}(10)
对比式 ( 9 ) (9) (9)和式 ( 10 ) (10) (10),可以发现,接受域和置信区间有相同的形式。
所以我们可以这样理解置信区间:当 μ 0 \mu_0 μ0落在 μ \mu μ的置信水平为 1 − α 1-\alpha 1−α的置信区间时,在显著性水平 α \alpha α下,没有理由拒绝 H 0 : μ = μ 0 H_0:\mu=\mu_0 H0:μ=μ0。
2.2 单样本正态总体方差的检验
均值 | 假设 | 检验统计量 | 拒绝域 |
---|---|---|---|
μ = μ 0 已 知 \mu=\mu_0已知 μ=μ0已知 | H 0 : σ 2 = σ 0 2 ↔ H 1 : σ 2 ≠ σ 0 2 H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\ne\sigma^2_0 H0:σ2=σ02↔H1:σ2=σ02 | χ 2 = ∑ i = 1 n ( X i − μ 0 ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0 χ2=i=1∑n(Xi−μ0)2/σ02 | { χ 2 < χ 1 − α / 2 2 ( n ) } ∪ { χ 2 > χ α / 2 2 ( n ) } \{\chi^2\lt\chi^2_{1-\alpha/2}(n)\}\cup\{\chi^2\gt\chi^2_{\alpha/2}(n)\} {χ2<χ1−α/22(n)}∪{χ2>χα/22(n)} |
μ = μ 0 \mu=\mu_0 μ=μ0已知 | H 0 : σ 2 = σ 0 2 ↔ H 1 : σ 2 < σ 0 2 H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\lt\sigma^2_0 H0:σ2=σ02↔H1:σ2<σ02 | χ 2 = ∑ i = 1 n ( X i − μ 0 ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0 χ2=i=1∑n(Xi−μ0)2/σ02 | { χ 2 < χ 1 − α / 2 2 ( n ) } \{\chi^2\lt\chi^2_{1-\alpha/2}(n)\} {χ2<χ1−α/22(n)} |
μ = μ 0 \mu=\mu_0 μ=μ0已知 | H 0 : σ 2 = σ 0 2 ↔ H 1 : σ 2 > σ 0 2 H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\gt\sigma^2_0 H0:σ2=σ02↔H1:σ2>σ02 | χ 2 = ∑ i = 1 n ( X i − μ 0 ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0 χ2=i=1∑n(Xi−μ0)2/σ02 | { χ 2 > χ α / 2 2 ( n ) } \{\chi^2\gt\chi^2_{\alpha/2}(n)\} {χ2>χα/22(n)} |
μ = μ 0 \mu=\mu_0 μ=μ0已知 | H 0 : σ 2 ≤ σ 0 2 ↔ H 1 : σ 2 > σ 0 2 H_0: \sigma^2\le\sigma^2_0\leftrightarrow H_1: \sigma^2\gt\sigma^2_0 H0:σ2≤σ02↔H1:σ2>σ02 | χ 2 = ∑ i = 1 n ( X i − μ 0 ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0 χ2=i=1∑n(Xi−μ0)2/σ02 | { χ 2 > χ α / 2 2 ( n ) } \{\chi^2\gt\chi^2_{\alpha/2}(n)\} {χ2>χα/22(n)} |
μ = μ 0 \mu=\mu_0 μ=μ0已知 | H 0 : σ 2 ≥ σ 0 2 ↔ H 1 : σ 2 < σ 0 2 H_0: \sigma^2\ge\sigma^2_0\leftrightarrow H_1: \sigma^2\lt\sigma^2_0 H0:σ2≥σ02↔H1:σ2<σ02 | χ 2 = ∑ i = 1 n ( X i − μ 0 ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0 χ2=i=1∑n(Xi−μ0)2/σ02 | { χ 2 < χ 1 − α / 2 2 ( n ) } \{\chi^2\lt\chi^2_{1-\alpha/2}(n)\} {χ2<χ1−α/22(n)} |
μ \mu μ未知 | H 0 : σ 2 = σ 0 2 ↔ H 1 : σ 2 ≠ σ 0 2 H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\ne\sigma^2_0 H0:σ2=σ02↔H1:σ2=σ02 | χ 2 = ∑ i = 1 n ( X i − X ‾ ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\overline X)^2/\sigma^2_0 χ2=i=1∑n(Xi−X)2/σ02 | { χ 2 < χ 1 − α / 2 2 ( n − 1 ) } ∪ { χ 2 > χ α / 2 2 ( n − 1 ) } \{\chi^2\lt\chi^2_{1-\alpha/2}(n-1)\}\cup\{\chi^2\gt\chi^2_{\alpha/2}(n-1)\} {χ2<χ1−α/22(n−1)}∪{χ2>χα/22(n−1)} |
μ \mu μ未知 | H 0 : σ 2 = σ 0 2 ↔ H 1 : σ 2 < σ 0 2 H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\lt\sigma^2_0 H0:σ2=σ02↔H1:σ2<σ02 | χ 2 = ∑ i = 1 n ( X i − X ‾ ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\overline X)^2/\sigma^2_0 χ2=i=1∑n(Xi−X)2/σ02 | { χ 2 < χ 1 − α / 2 2 ( n − 1 ) } \{\chi^2\lt\chi^2_{1-\alpha/2}(n-1)\} {χ2<χ1−α/22(n−1)} |
μ \mu μ未知 | H 0 : σ 2 = σ 0 2 ↔ H 1 : σ 2 > σ 0 2 H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\gt\sigma^2_0 H0:σ2=σ02↔H1:σ2>σ02 | χ 2 = ∑ i = 1 n ( X i − X ‾ ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\overline X)^2/\sigma^2_0 χ2=i=1∑n(Xi−X)2/σ02 | { χ 2 > χ α / 2 2 ( n − 1 ) } \{\chi^2\gt\chi^2_{\alpha/2}(n-1)\} {χ2>χα/22(n−1)} |
μ \mu μ未知 | H 0 : σ 2 ≤ σ 0 2 ↔ H 1 : σ 2 > σ 0 2 H_0: \sigma^2\le\sigma^2_0\leftrightarrow H_1: \sigma^2\gt\sigma^2_0 H0:σ2≤σ02↔H1:σ2>σ02 | χ 2 = ∑ i = 1 n ( X i − X ‾ ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\overline X)^2/\sigma^2_0 χ2=i=1∑n(Xi−X)2/σ02 | { χ 2 > χ α / 2 2 ( n − 1 ) } \{\chi^2\gt\chi^2_{\alpha/2}(n-1)\} {χ2>χα/22(n−1)} |
μ \mu μ未知 | H 0 : σ 2 ≥ σ 0 2 ↔ H 1 : σ 2 < σ 0 2 H_0: \sigma^2\ge\sigma^2_0\leftrightarrow H_1: \sigma^2\lt\sigma^2_0 H0:σ2≥σ02↔H1:σ2<σ02 | χ 2 = ∑ i = 1 n ( X i − X ‾ ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\overline X)^2/\sigma^2_0 χ2=i=1∑n(Xi−X)2/σ02 | { χ 2 < χ 1 − α / 2 2 ( n − 1 ) } \{\chi^2\lt\chi^2_{1-\alpha/2}(n-1)\} {χ2<χ1−α/22(n−1)} |
以 μ = μ 0 \mu=\mu_0 μ=μ0时,求检验 H 0 : σ 2 = σ 0 2 ↔ H 1 : σ 2 ≠ σ 0 2 H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\ne\sigma^2_0 H0:σ2=σ02↔H1:σ2=σ02的拒绝域为例。
当
μ
=
μ
0
\mu=\mu_0
μ=μ0已知时,
∑
i
=
1
n
(
X
i
−
μ
0
)
2
\sum\limits_{i=1}^n(X_i-\mu_0)^2
i=1∑n(Xi−μ0)2是
σ
2
\sigma^2
σ2的一个很好的点估计,且当
H
0
H_0
H0成立时,
∑
i
=
1
n
(
X
i
−
μ
0
)
2
/
σ
0
2
∼
χ
2
(
n
)
\sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0\sim \chi^2(n)
i=1∑n(Xi−μ0)2/σ02∼χ2(n),于是,可以选取统计量为
χ
2
=
∑
i
=
1
n
(
X
i
−
μ
0
)
2
σ
0
2
(11)
\chi^2=\frac{\sum\limits_{i=1}^n(X_i-\mu_0)^2}{\sigma^2_0}\tag{11}
χ2=σ02i=1∑n(Xi−μ0)2(11)
另外,由备择假设的形式可知其拒绝域为
W
=
{
χ
2
<
c
1
}
∪
{
χ
2
>
c
2
}
(12)
W=\{\chi^2\lt c_1\}\cup\{\chi^2\gt c_2\}\tag{12}
W={χ2<c1}∪{χ2>c2}(12)
其中,
c
1
,
c
2
c_1, c_2
c1,c2为两个待定的常数,且由检验的显著性水平
α
\alpha
α来确定,即它们满足
P
H
0
{
χ
2
<
c
1
}
+
P
H
0
{
χ
2
>
c
2
}
≤
α
(13)
P_{H_0}\{\chi^2\lt c_1\}+P_{H_0}\{\chi^2\gt c_2\}\le\alpha\tag{13}
PH0{χ2<c1}+PH0{χ2>c2}≤α(13)
由于
χ
2
\chi^2
χ2分布的图像并不是对称的,所以
c
1
,
c
2
c_1, c_2
c1,c2不能直接确定。于是,一个常用的方法是如下选取
c
1
,
c
2
c_1, c_2
c1,c2,
P
H
0
{
χ
2
<
c
1
}
≤
α
/
2
,
P
H
0
{
χ
2
>
c
2
}
≤
α
/
2
(14)
P_{H_0}\{\chi^2\lt c_1\}\le\alpha/2, P_{H_0}\{\chi^2\gt c_2\}\le\alpha/2\tag{14}
PH0{χ2<c1}≤α/2,PH0{χ2>c2}≤α/2(14)
这样可以保证第一类错误概率为 α \alpha α的情况下,第二类错误概率最小
从而可以得到 c 1 = χ 1 − α / 2 2 ( n ) , c 2 = χ α / 2 2 ( n ) c_1=\chi^2_{1-\alpha/2}(n), c_2=\chi^2_{\alpha/2}(n) c1=χ1−α/22(n),c2=χα/22(n)
三、两样本正态总体参数的显著性检验
设 X 1 , ⋯ , X m X_1,\cdots,X_m X1,⋯,Xm为来自正态总体 N ( μ 1 , σ 1 2 ) N(\mu_1,\sigma^2_1) N(μ1,σ12)的 I I D IID IID样本, Y 1 , ⋯ , Y n Y_1,\cdots,Y_n Y1,⋯,Yn为来自正态总体 N ( μ 2 , σ 2 2 ) N(\mu_2,\sigma^2_2) N(μ2,σ22)的 I I D IID IID样本,且两样本是独立的。
3.1 两样本正态总体均值的显著性检验
方差 | 假设 | 检验统计量 | 拒绝域 |
---|---|---|---|
σ 1 2 , σ 2 2 \sigma^2_1, \sigma^2_2 σ12,σ22已知 | H 0 : μ 1 = μ 2 ↔ H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2\leftrightarrow H_1:\mu_1\ne\mu_2 H0:μ1=μ2↔H1:μ1=μ2 | U = ( X ‾ − Y ‾ ) / σ 1 2 / m + σ 2 2 / n U=(\overline X-\overline Y)/\sqrt{\sigma^2_1/m+\sigma^2_2/n} U=(X−Y)/σ12/m+σ22/n | { ∣ U ∣ > u α / 2 } \{\mid U\mid\gt u_{\alpha/2}\} {∣U∣>uα/2} |
σ 1 2 , σ 2 2 \sigma^2_1, \sigma^2_2 σ12,σ22已知 | H 0 : μ 1 ≤ μ 2 ↔ H 1 : μ 1 > μ 2 H_0:\mu_1\le\mu_2\leftrightarrow H_1:\mu_1\gt\mu_2 H0:μ1≤μ2↔H1:μ1>μ2 | U = ( X ‾ − Y ‾ ) / σ 1 2 / m + σ 2 2 / n U=(\overline X-\overline Y)/\sqrt{\sigma^2_1/m+\sigma^2_2/n} U=(X−Y)/σ12/m+σ22/n | { U > u α } \{U\gt u_{\alpha}\} {U>uα} |
σ 1 2 , σ 2 2 \sigma^2_1, \sigma^2_2 σ12,σ22已知 | H 0 : μ 1 ≥ μ 2 ↔ H 1 : μ 1 < μ 2 H_0:\mu_1\ge\mu_2\leftrightarrow H_1:\mu_1\lt\mu_2 H0:μ1≥μ2↔H1:μ1<μ2 | U = ( X ‾ − Y ‾ ) / σ 1 2 / m + σ 2 2 / n U=(\overline X-\overline Y)/\sqrt{\sigma^2_1/m+\sigma^2_2/n} U=(X−Y)/σ12/m+σ22/n | { U < − u α } \{ U\lt -u_{\alpha}\} {U<−uα} |
σ 1 2 = σ 2 2 \sigma^2_1=\sigma^2_2 σ12=σ22未知 | H 0 : μ 1 = μ 2 ↔ H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2\leftrightarrow H_1:\mu_1\ne\mu_2 H0:μ1=μ2↔H1:μ1=μ2 | T = m n / ( m + n ) ( X ‾ − Y ‾ ) / S m n ∗ 2 T=\sqrt{mn/(m+n)}(\overline X-\overline Y)/S_{mn}^{*2} T=mn/(m+n)(X−Y)/Smn∗2 | { ∣ T ∣ > t α / 2 ( m + n − 2 ) } \{\mid T\mid\gt t_{\alpha/2}(m+n-2)\} {∣T∣>tα/2(m+n−2)} |
σ 1 2 = σ 2 2 \sigma^2_1=\sigma^2_2 σ12=σ22未知 | H 0 : μ 1 ≤ μ 2 ↔ H 1 : μ 1 > μ 2 H_0:\mu_1\le\mu_2\leftrightarrow H_1:\mu_1\gt\mu_2 H0:μ1≤μ2↔H1:μ1>μ2 | T = m n / ( m + n ) ( X ‾ − Y ‾ ) / S m n ∗ 2 T=\sqrt{mn/(m+n)}(\overline X-\overline Y)/S_{mn}^{*2} T=mn/(m+n)(X−Y)/Smn∗2 | { T > t α ( m + n − 2 ) } \{T\gt t_{\alpha}(m+n-2)\} {T>tα(m+n−2)} |
σ 1 2 = σ 2 2 \sigma^2_1=\sigma^2_2 σ12=σ22未知 | H 0 : μ 1 ≥ μ 2 ↔ H 1 : μ 1 < μ 2 H_0:\mu_1\ge\mu_2\leftrightarrow H_1:\mu_1\lt\mu_2 H0:μ1≥μ2↔H1:μ1<μ2 | T = m n / ( m + n ) ( X ‾ − Y ‾ ) / S m n ∗ 2 T=\sqrt{mn/(m+n)}(\overline X-\overline Y)/S_{mn}^{*2} T=mn/(m+n)(X−Y)/Smn∗2 | { T < − t α ( m + n − 2 ) } \{T\lt -t_{\alpha}(m+n-2)\} {T<−tα(m+n−2)} |
σ 1 2 \sigma^2_1 σ12, σ 2 2 \sigma^2_2 σ22未知,且 m , n m, n m,n都比较大 | H 0 : μ 1 = μ 2 ↔ H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2\leftrightarrow H_1:\mu_1\ne\mu_2 H0:μ1=μ2↔H1:μ1=μ2 | U = ( X ‾ − Y ‾ ) / S 1 m 2 / m + S 2 n 2 / n U=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n} U=(X−Y)/S1m2/m+S2n2/n | { ∣ U ∣ > u α / 2 } \{\mid U\mid\gt u_{\alpha/2}\} {∣U∣>uα/2} |
σ 1 2 \sigma^2_1 σ12, σ 2 2 \sigma^2_2 σ22未知,且 m , n m, n m,n都比较大 | H 0 : μ 1 ≤ μ 2 ↔ H 1 : μ 1 > μ 2 H_0:\mu_1\le\mu_2\leftrightarrow H_1:\mu_1\gt\mu_2 H0:μ1≤μ2↔H1:μ1>μ2 | U = ( X ‾ − Y ‾ ) / S 1 m 2 / m + S 2 n 2 / n U=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n} U=(X−Y)/S1m2/m+S2n2/n | { U > u α } \{U\gt u_{\alpha}\} {U>uα} |
σ 1 2 \sigma^2_1 σ12, σ 2 2 \sigma^2_2 σ22未知,且 m , n m, n m,n都比较大 | H 0 : μ 1 ≥ μ 2 ↔ H 1 : μ 1 < μ 2 H_0:\mu_1\ge\mu_2\leftrightarrow H_1:\mu_1\lt\mu_2 H0:μ1≥μ2↔H1:μ1<μ2 | U = ( X ‾ − Y ‾ ) / S 1 m 2 / m + S 2 n 2 / n U=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n} U=(X−Y)/S1m2/m+S2n2/n | { U < − u α } \{ U\lt -u_{\alpha}\} {U<−uα} |
σ 1 2 \sigma^2_1 σ12, σ 2 2 \sigma^2_2 σ22未知,且 m , n m, n m,n都比较小 | H 0 : μ 1 = μ 2 ↔ H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2\leftrightarrow H_1:\mu_1\ne\mu_2 H0:μ1=μ2↔H1:μ1=μ2 | T = ( X ‾ − Y ‾ ) / S 1 m 2 / m + S 2 n 2 / n T=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n} T=(X−Y)/S1m2/m+S2n2/n | { ∣ T ∣ > t α / 2 ( r ) } \{\mid T\mid\gt t_{\alpha/2}(r)\} {∣T∣>tα/2(r)} |
σ 1 2 \sigma^2_1 σ12, σ 2 2 \sigma^2_2 σ22未知,且 m , n m, n m,n都比较小 | H 0 : μ 1 ≤ μ 2 ↔ H 1 : μ 1 > μ 2 H_0:\mu_1\le\mu_2\leftrightarrow H_1:\mu_1\gt\mu_2 H0:μ1≤μ2↔H1:μ1>μ2 | T = ( X ‾ − Y ‾ ) / S 1 m 2 / m + S 2 n 2 / n T=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n} T=(X−Y)/S1m2/m+S2n2/n | { T > t α ( r ) } \{T\gt t_{\alpha}(r)\} {T>tα(r)} |
σ 1 2 \sigma^2_1 σ12, σ 2 2 \sigma^2_2 σ22未知,且 m , n m, n m,n都比较小 | H 0 : μ 1 ≥ μ 2 ↔ H 1 : μ 1 < μ 2 H_0:\mu_1\ge\mu_2\leftrightarrow H_1:\mu_1\lt\mu_2 H0:μ1≥μ2↔H1:μ1<μ2 | T = ( X ‾ − Y ‾ ) / S 1 m 2 / m + S 2 n 2 / n T=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n} T=(X−Y)/S1m2/m+S2n2/n | { T < − t α ( r ) } \{T\lt -t_{\alpha}(r)\} {T<−tα(r)} |
其中,
S
m
n
∗
2
=
∑
i
=
1
m
(
X
i
−
X
‾
)
2
+
∑
i
=
1
n
(
Y
i
−
Y
‾
)
2
m
+
n
(15)
S_{mn}^{*2}=\frac{\sum\limits_{i=1}^m(X_i-\overline X)^2+\sum\limits_{i=1}^n(Y_i-\overline Y)^2}{m+n}\tag{15}
Smn∗2=m+ni=1∑m(Xi−X)2+i=1∑n(Yi−Y)2(15)
r
=
S
m
n
4
S
1
m
4
m
2
(
m
−
1
)
+
S
2
n
4
n
2
(
n
−
1
)
(16)
r=\frac{S_{mn}^4}{\frac{S_{1m}^4}{m^2(m-1)}+\frac{S_{2n}^4}{n^2(n-1)}}\tag{16}
r=m2(m−1)S1m4+n2(n−1)S2n4Smn4(16)
其中
S
m
n
2
=
S
1
m
2
m
+
S
2
n
2
n
S_{mn}^2=\frac{S_{1m}^2}{m}+\frac{S_{2n}^2}{n}
Smn2=mS1m2+nS2n2
以 σ 1 2 = σ 2 2 \sigma^2_1=\sigma^2_2 σ12=σ22未知,求解检验 H 0 : μ 1 = μ 2 ↔ H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2\leftrightarrow H_1:\mu_1\ne\mu_2 H0:μ1=μ2↔H1:μ1=μ2的拒绝域为例进行说明:
由于 X ‾ \overline X X, Y ‾ \overline Y Y分别是 μ 1 \mu_1 μ1, μ 2 \mu_2 μ2的一个很好的点估计,故可用 X ‾ − Y ‾ \overline X-\overline Y X−Y来反映 μ 1 \mu_1 μ1和 μ 2 \mu_2 μ2的区别。考虑到假设的特点,我们知道,当 ∣ X ‾ − Y ‾ ∣ ≥ c \mid \overline X-\overline Y\mid\ge c ∣X−Y∣≥c时,有理由拒绝 H 0 H_0 H0,其中常数 c c c由此检验犯第一类错误的概率 α \alpha α决定。
当 H 0 H_0 H0成立时, X ‾ − Y ‾ ∼ N ( 0 , m + n m n σ 2 ) \overline X-\overline Y\sim N(0,\frac{m+n}{mn}\sigma^2) X−Y∼N(0,mnm+nσ2),其中 σ 2 \sigma^2 σ2未知。此时可利用总的样本方差 S m n ∗ 2 = ∑ i = 1 m ( X i − X ‾ ) 2 + ∑ i = 1 n ( Y i − Y ‾ ) 2 m + n (17) S_{mn}^{*2}=\frac{\sum\limits_{i=1}^m(X_i-\overline X)^2+\sum\limits_{i=1}^n(Y_i-\overline Y)^2}{m+n}\tag{17} Smn∗2=m+ni=1∑m(Xi−X)2+i=1∑n(Yi−Y)2(17)来估计 σ 2 \sigma^2 σ2,且在 H 0 H_0 H0成立时, ( m + n − 2 ) S m n ∗ 2 / σ 2 ∼ χ 2 ( m + n − 2 ) (m+n-2)S_{mn}^{*2}/\sigma^2\sim\chi^2(m+n-2) (m+n−2)Smn∗2/σ2∼χ2(m+n−2)(详情见数理统计复习笔记一——统计中常用的抽样分布(卡方分布,t分布,F分布))。
于是,一个自然的检验统计量为
T
=
(
X
‾
−
Y
‾
)
/
[
σ
(
m
+
n
)
/
m
n
]
(
m
+
n
−
2
)
S
m
n
∗
2
/
[
σ
2
(
m
+
n
−
2
)
]
=
m
n
m
+
n
X
‾
−
Y
‾
S
m
n
∗
(18)
T=\frac{(\overline X-\overline Y)/[\sigma\sqrt{(m+n)/mn}]}{\sqrt{(m+n-2)S_{mn}^{*2}/[\sigma^2(m+n-2)]}}=\frac{mn}{m+n}\frac{\overline X-\overline Y}{S_{mn}^*}\tag{18}
T=(m+n−2)Smn∗2/[σ2(m+n−2)](X−Y)/[σ(m+n)/mn]=m+nmnSmn∗X−Y(18)
且当
H
0
H_0
H0成立时,
T
∼
t
(
m
+
n
−
2
)
T\sim t(m+n-2)
T∼t(m+n−2),所以在显著性水平为
α
\alpha
α下,可以得到拒绝域为:
{
∣
T
∣
>
t
α
/
2
(
m
+
n
−
2
)
}
(19)
\{\mid T\mid\gt t_{\alpha/2}(m+n-2)\}\tag{19}
{∣T∣>tα/2(m+n−2)}(19)
3.2 两样本正态总体方差的显著性检验
均值 | 假设 | 检验统计量 | 拒绝域 |
---|---|---|---|
μ 1 , μ 2 \mu_1, \mu_2 μ1,μ2已知 | H 0 : σ 1 2 = σ 2 2 ↔ H 1 : σ 1 2 ≠ σ 2 2 H_0:\sigma_1^2=\sigma_2^2\leftrightarrow H_1:\sigma_1^2\ne\sigma_2^2 H0:σ12=σ22↔H1:σ12=σ22 | F = ∑ i = 1 m ( X i − μ 1 ) 2 / m ∑ i = 1 n ( Y i − μ 2 ) 2 / n F=\frac{\sum\limits_{i=1}^m(X_i-\mu_1)^2/m}{\sum\limits_{i=1}^n(Y_i-\mu_2)^2/n} F=i=1∑n(Yi−μ2)2/ni=1∑m(Xi−μ1)2/m | { F < F 1 − α / 2 ( m , n ) } ∪ { F > F α / 2 ( m , n ) } \{F\lt F_{1-\alpha/2}(m,n)\}\cup\{F\gt F_{\alpha/2}(m,n)\} {F<F1−α/2(m,n)}∪{F>Fα/2(m,n)} |
μ 1 , μ 2 \mu_1, \mu_2 μ1,μ2已知 | H 0 : σ 1 2 ≤ σ 2 2 ↔ H 1 : σ 1 2 > σ 2 2 H_0:\sigma_1^2\le\sigma_2^2\leftrightarrow H_1:\sigma_1^2\gt\sigma_2^2 H0:σ12≤σ22↔H1:σ12>σ22 | F = ∑ i = 1 m ( X i − μ 1 ) 2 / m ∑ i = 1 n ( Y i − μ 2 ) 2 / n F=\frac{\sum\limits_{i=1}^m(X_i-\mu_1)^2/m}{\sum\limits_{i=1}^n(Y_i-\mu_2)^2/n} F=i=1∑n(Yi−μ2)2/ni=1∑m(Xi−μ1)2/m | { F > F α ( m , n ) } \{F\gt F_{\alpha}(m,n)\} {F>Fα(m,n)} |
μ 1 , μ 2 \mu_1, \mu_2 μ1,μ2已知 | H 0 : σ 1 2 ≥ σ 2 2 ↔ H 1 : σ 1 2 < σ 2 2 H_0:\sigma_1^2\ge\sigma_2^2\leftrightarrow H_1:\sigma_1^2\lt\sigma_2^2 H0:σ12≥σ22↔H1:σ12<σ22 | F = ∑ i = 1 m ( X i − μ 1 ) 2 / m ∑ i = 1 n ( Y i − μ 2 ) 2 / n F=\frac{\sum\limits_{i=1}^m(X_i-\mu_1)^2/m}{\sum\limits_{i=1}^n(Y_i-\mu_2)^2/n} F=i=1∑n(Yi−μ2)2/ni=1∑m(Xi−μ1)2/m | { F < F 1 − α ( m , n ) } \{F\lt F_{1-\alpha}(m,n)\} {F<F1−α(m,n)} |
μ 1 , μ 2 \mu_1, \mu_2 μ1,μ2未知 | H 0 : σ 1 2 = σ 2 2 ↔ H 1 : σ 1 2 ≠ σ 2 2 H_0:\sigma_1^2=\sigma_2^2\leftrightarrow H_1:\sigma_1^2\ne\sigma_2^2 H0:σ12=σ22↔H1:σ12=σ22 | F = ∑ i = 1 m ( X i − X ‾ ) 2 / ( m − 1 ) ∑ i = 1 n ( Y i − Y ‾ ) 2 / ( n − 1 ) F=\frac{\sum\limits_{i=1}^m(X_i-\overline X)^2/(m-1)}{\sum\limits_{i=1}^n(Y_i-\overline Y)^2/(n-1)} F=i=1∑n(Yi−Y)2/(n−1)i=1∑m(Xi−X)2/(m−1) | { F < F 1 − α / 2 ( m − 1 , n − 1 ) } ∪ { F > F α / 2 ( m − 1 , n − 1 ) } \{F\lt F_{1-\alpha/2}(m-1,n-1)\}\cup\{F\gt F_{\alpha/2}(m-1,n-1)\} {F<F1−α/2(m−1,n−1)}∪{F>Fα/2(m−1,n−1)} |
μ 1 , μ 2 \mu_1, \mu_2 μ1,μ2未知 | H 0 : σ 1 2 ≤ σ 2 2 ↔ H 1 : σ 1 2 > σ 2 2 H_0:\sigma_1^2\le\sigma_2^2\leftrightarrow H_1:\sigma_1^2\gt\sigma_2^2 H0:σ12≤σ22↔H1:σ12>σ22 | F = ∑ i = 1 m ( X i − X ‾ ) 2 / ( m − 1 ) ∑ i = 1 n ( Y i − Y ‾ ) 2 / ( n − 1 ) F=\frac{\sum\limits_{i=1}^m(X_i-\overline X)^2/(m-1)}{\sum\limits_{i=1}^n(Y_i-\overline Y)^2/(n-1)} F=i=1∑n(Yi−Y)2/(n−1)i=1∑m(Xi−X)2/(m−1) | { F > F α ( m − 1 , n − 1 ) } \{F\gt F_{\alpha}(m-1,n-1)\} {F>Fα(m−1,n−1)} |
μ 1 , μ 2 \mu_1, \mu_2 μ1,μ2未知 | H 0 : σ 1 2 ≥ σ 2 2 ↔ H 1 : σ 1 2 < σ 2 2 H_0:\sigma_1^2\ge\sigma_2^2\leftrightarrow H_1:\sigma_1^2\lt\sigma_2^2 H0:σ12≥σ22↔H1:σ12<σ22 | F = ∑ i = 1 m ( X i − X ‾ ) 2 / ( m − 1 ) ∑ i = 1 n ( Y i − Y ‾ ) 2 / ( n − 1 ) F=\frac{\sum\limits_{i=1}^m(X_i-\overline X)^2/(m-1)}{\sum\limits_{i=1}^n(Y_i-\overline Y)^2/(n-1)} F=i=1∑n(Yi−Y)2/(n−1)i=1∑m(Xi−X)2/(m−1) | { F < F 1 − α ( m − 1 , n − 1 ) } \{F\lt F_{1-\alpha}(m-1,n-1)\} {F<F1−α(m−1,n−1)} |
四、似然比检验
4.1 相关定义
4.1.1 似然比统计量
设
X
1
,
⋯
,
X
n
X_1,\cdots,X_n
X1,⋯,Xn为来自分布族
F
=
{
f
(
x
,
θ
)
:
θ
∈
Θ
}
\mathcal F=\{f(x,\theta):\theta\in\Theta\}
F={f(x,θ):θ∈Θ}的
I
I
D
IID
IID样本,对于假设
H
0
:
θ
∈
Θ
↔
H
1
:
θ
∈
Θ
1
=
Θ
−
θ
0
(20)
H_0:\theta\in\Theta\leftrightarrow H_1:\theta\in\Theta_1=\Theta-\theta_0\tag{20}
H0:θ∈Θ↔H1:θ∈Θ1=Θ−θ0(20)
令
λ
(
X
)
=
sup
θ
∈
Θ
0
f
(
X
,
θ
)
sup
θ
∈
Θ
f
(
X
,
θ
)
(21)
\lambda(\bm X)=\frac{\sup\limits_{\theta\in\Theta_0}f(\bm X,\theta)}{\sup\limits_{\theta\in\Theta}f(\bm X,\theta)}\tag{21}
λ(X)=θ∈Θsupf(X,θ)θ∈Θ0supf(X,θ)(21)
则称统计量
λ
(
X
)
\lambda(\bm X)
λ(X)为假设
(
20
)
(20)
(20)的似然比,也称为广义似然比
从 λ ( X ) \lambda(\bm X) λ(X)的定义不难看出,如果 λ ( X ) \lambda(\bm X) λ(X)的值很小,则说明 θ ∈ Θ 0 \theta\in\Theta_0 θ∈Θ0的可能性要比 θ ∈ Θ \theta\in\Theta θ∈Θ的可能性小,于是我们有理由认为 H 0 H_0 H0不成立。这样就有如下的似然比检验。
4.1.2 似然比检验
采用
(
21
)
(21)
(21)式的似然比统计量
λ
(
X
)
\lambda(\bm X)
λ(X)作为假设
(
20
)
(20)
(20)的检验统计量,且取其拒绝域为
{
λ
(
x
)
≤
c
}
\{\lambda(\bm x)\le c\}
{λ(x)≤c},其中临界值
c
c
c满足
P
θ
{
λ
(
X
)
≤
c
}
≤
α
,
∀
θ
∈
Θ
0
(22)
P_{\theta}\{\lambda(\bm X)\le c\}\le \alpha, \forall\theta\in\Theta_0\tag{22}
Pθ{λ(X)≤c}≤α,∀θ∈Θ0(22)
则称此检验为显著性水平为
α
\alpha
α的似然比检验。
如果似然比统计量的零分布未知,则很难确定似然比检验的临界值。但如果此时存在一个统计量 T ( X ) T(\bm X) T(X)关于似然比统计量式单调的且零分布已知,则可以给出一个基于 T ( X ) T(\bm X) T(X)的显著性检验。
4.2 例子
设 X 1 , ⋯ , X n X_1,\cdots,X_n X1,⋯,Xn是来自正态总体 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)的 I I D IID IID样本, μ , σ 2 \mu,\sigma^2 μ,σ2均未知。试求假设 H 0 : μ = μ 0 ↔ H 1 μ ≠ μ 0 H_0:\mu=\mu_0\leftrightarrow H_1\mu\ne\mu_0 H0:μ=μ0↔H1μ=μ0的显著性水平为 α \alpha α的似然比检验。
解:
此时样本分布为
f
(
x
,
θ
)
=
(
2
π
σ
2
)
−
n
/
2
exp
[
−
1
2
σ
2
∑
i
=
1
n
(
X
i
−
μ
)
2
]
f(\bm x, \theta)=(2\pi\sigma^2)^{-n/2}\exp[-\frac{1}{2\sigma^2}\sum\limits_{i=1}^n(X_i-\mu)^2]
f(x,θ)=(2πσ2)−n/2exp[−2σ21i=1∑n(Xi−μ)2],
Θ
0
=
{
(
μ
0
,
σ
2
)
:
σ
2
>
0
}
\Theta_0=\{(\mu_0,\sigma^2):\sigma^2\gt0\}
Θ0={(μ0,σ2):σ2>0},
Θ
=
{
(
μ
,
σ
2
)
:
μ
∈
R
,
σ
2
>
0
}
\Theta=\{(\mu,\sigma^2):\mu\in\bm R, \sigma^2\gt0\}
Θ={(μ,σ2):μ∈R,σ2>0}
则似然比统计量为
λ
(
x
)
=
sup
θ
∈
Θ
0
f
(
x
,
θ
)
sup
θ
∈
Θ
f
(
x
,
θ
)
=
[
∑
i
=
1
n
(
x
i
−
x
‾
)
2
∑
i
=
1
n
(
x
i
−
μ
0
)
2
]
n
/
2
=
(
1
+
T
2
n
−
1
)
−
n
/
2
\lambda(\bm x)=\frac{\sup\limits_{\theta\in\Theta_0}f(\bm x,\theta)}{\sup\limits_{\theta\in\Theta}f(\bm x,\theta)}=[\frac{\sum\limits_{i=1}^n(x_i-\overline x)^2}{\sum\limits_{i=1}^n(x_i-\mu_0)^2}]^{n/2}=(1+\frac{T^2}{n-1})^{-n/2}
λ(x)=θ∈Θsupf(x,θ)θ∈Θ0supf(x,θ)=[i=1∑n(xi−μ0)2i=1∑n(xi−x)2]n/2=(1+n−1T2)−n/2
其中,
T
=
n
(
x
‾
−
μ
0
)
S
n
T=\frac{\sqrt n(\overline x-\mu_0)}{S_n}
T=Snn(x−μ0)
所以此时的似然比统计量与传统的
t
t
t统计量的平方成反比,于是,两个检验统计量的拒绝域有如下关系:
{
λ
(
x
)
≤
c
}
⇔
{
∣
T
(
x
)
∣
≥
d
}
(23)
\{\lambda(\bm x)\le c\}\Leftrightarrow\{\mid T(\bm x)\mid\ge d\}\tag{23}
{λ(x)≤c}⇔{∣T(x)∣≥d}(23)
所以,此时的似然比检验与双侧
t
t
t检验完全等价