数理统计复习笔记五——假设检验之显著性检验

一、基本概念

在统计中,我们把需要用样本去推断“正确”与否的命题称为一个假设。当然,假设是可以关于参数的,也可以是关于分布的。

通过样本对一个假设作出“对”或“不对”的具体判断规则就称为该假设的一个检验。检验的结果若“是”,则否定该命题,就称拒绝该假设,否则就称为接受原假设这里的拒绝和接受原假设,只是在当前样本下作出的判断,并没有从逻辑或理论上“证明”该命题正确与否。

设有样本 X X X,取值于样本空间 X \mathcal X X,且知道样本来自某一个参数分布族 { F ( x , θ ) : θ ∈ Θ } \{F(x,\theta): \theta\in\Theta\} {F(x,θ):θΘ},其中 Θ \Theta Θ为参数空间。设 Θ 0 ⊂ Θ \Theta_0\subset\Theta Θ0Θ,且 Θ 0 ≠ ∅ \Theta_0\ne\varnothing Θ0=,则命题 H 0 : θ ∈ Θ 0 H_0:\theta\in\Theta_0 H0:θΘ0称为一个假设或零假设。如记 Θ 1 = Θ − Θ 0 \Theta_1=\Theta-\Theta_0 Θ1=ΘΘ0,则命题 H 1 : θ ∈ Θ 1 H_1:\theta\in\Theta_1 H1:θΘ1称为 H 0 H_0 H0备择假设。于是 H 0 : θ ∈ Θ 0 ↔ H 1 : θ ∈ Θ 1 (1) H_0:\theta\in\Theta_0\leftrightarrow H_1:\theta\in\Theta_1\tag1 H0:θΘ0H1:θΘ1(1)
称为假设检验问题

对于上述假设的检验就是指这样一个法则或策略:当有了具体的样本后,由该法则或策略就可决定是接受 H 0 H_0 H0还是拒绝 H 0 H_0 H0,即检验就等价于把样本空间 X \mathcal X X划分成两个互不相交的部分 W W W W ‾ \overline W W,当样本属于 W ‾ \overline W W时,接受 H 0 H_0 H0;否则拒绝 H 0 H_0 H0。于是,我们称 W W W为该检验的拒绝域,而 W ‾ \overline W W称为接受域

由于样本是随机的,所以我们有可能会做出错误的决策,即当 θ ∈ Θ 0 \theta\in\Theta_0 θΘ0时,样本却落入了拒绝域 W W W,于是采取了拒绝 H 0 H_0 H0的错误决策,称这样的错误为第一类错误;当 θ ∈ Θ 1 \theta\in\Theta_1 θΘ1时,样本却落入了接受域 W ‾ \overline W W,于是采取了接受 H 0 H_0 H0的错误决策,称这样的错误为第二类错误。具体可见下表:

决策 H 0 H_0 H0为真 H 1 H_1 H1为真
接受 H 0 H_0 H0正确第二类错误
拒绝 H 0 H_0 H0第一类错误正确
  • 定义犯第一类错误的概率为 α = P { X ∈ W ∣ H 0 } \alpha=P\{\bm X\in W|H_0\} α=P{XWH0}
  • 定义犯第二类错误的概率为 β = P { X ∈ W ‾ ∣ H 1 } \beta=P\{\bm X\in\overline W|H_1\} β=P{XWH1}
  • 对于固定的样本容量,找不到一个检验方法,使得犯第一、二类错误的概率均达到最小

势函数:对于假设 ( 1 ) (1) (1)的一个检验方法 ψ \psi ψ,其拒绝域记作 W W W,则称 β ψ ( θ ) = P θ { X ∈ W } , ∀ θ ∈ Θ (2) \beta_\psi(\theta)=P_\theta\{\bm X\in W\}, \forall\theta\in\Theta\tag2 βψ(θ)=Pθ{XW},θΘ(2)
为此检验的势函数。

所以当 θ ∈ Θ 0 \theta\in\Theta_0 θΘ0时,此检验犯第一类错误的概率等于其势函数 β ψ ( θ ) \beta_\psi(\theta) βψ(θ);而当 θ ∈ Θ 1 \theta\in\Theta_1 θΘ1时,检验犯第二类错误的概率等于 1 − β ψ ( θ ) 1-\beta_\psi(\theta) 1βψ(θ)

显著性水平:对于检验 ψ \psi ψ和事先给定的 α ∈ ( 0 , 1 ) \alpha\in(0,1) α(0,1),如果它满足 P θ { X ∈ W } ≤ α , ∀ θ ∈ Θ 0 (3) P_\theta\{\bm X\in W\}\le\alpha, \forall \theta\in\Theta_0\tag3 Pθ{XW}α,θΘ0(3)
则称 α \alpha α是检验 ψ \psi ψ的显著性水平或水平,也称 ψ \psi ψ为显著性水平 α \alpha α的检验。即检验 ψ \psi ψ犯第一类错误的概率不大于 α \alpha α.

只控制一个检验犯第一类错误的概率时,称这样的检验为显著性检验。一般情况下,求取某假设的显著性检验的步骤如下:

  1. 根据实际问题,建立统计假设 H 0 ↔ H 1 H_0\leftrightarrow H_1 H0H1
  2. 选取一个合适的统计量 T ( X ) T(\bm X) T(X),使当 H 0 H_0 H0成立时, T T T的分布已知,且与参数 θ \theta θ无关(称此分布为统计量 T T T的零分布)
  3. 根据 H 0 H_0 H0 H 1 H_1 H1的特点,确定拒绝域 W W W的区间形式
  4. 对于给定的显著性水平 α \alpha α,确定拒绝域 W W W
  5. 由样本观测值 x \bm x x,计算统计量 T ( X ) T(\bm X) T(X)的值 T ( x ) T(\bm x) T(x),由 T ( x ) T(\bm x) T(x)是否属于 W W W,作出最终判断。

二、单样本正态总体参数的显著性检验

在本节中,始终假设 X 1 , ⋯   , X n X_1,\cdots,X_n X1,,Xn为来自正态总体 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2) I I D IID IID样本,且我们感兴趣的是关于 μ \mu μ σ 2 \sigma^2 σ2的检验问题。

2.1 单样本正态总体均值的检验

方差假设检验统计量拒绝域名字
σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 H 0 : μ = μ 0 ↔ H 1 : μ ≠ μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\ne\mu_0 H0:μ=μ0H1:μ=μ0 U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n (Xμ0)/σ0 { ∣ U ∣ > u α / 2 } \{\mid U\mid\gt u_{\alpha/2}\} {U>uα/2}双侧 u u u检验
σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 H 0 : μ = μ 0 ↔ H 1 : μ < μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\lt\mu_0 H0:μ=μ0H1:μ<μ0 U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n (Xμ0)/σ0 { U < − u α } \{U\lt -u_{\alpha}\} {U<uα}单侧 u u u检验
σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 H 0 : μ = μ 0 ↔ H 1 : μ > μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\gt\mu_0 H0:μ=μ0H1:μ>μ0 U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n (Xμ0)/σ0 { U > u α } \{U\gt u_{\alpha}\} {U>uα}单侧 u u u检验
σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 H 0 : μ ≤ μ 0 ↔ H 1 : μ > μ 0 H_0:\mu\le\mu_0 \leftrightarrow H_1:\mu\gt\mu_0 H0:μμ0H1:μ>μ0 U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n (Xμ0)/σ0 { U > u α } \{U\gt u_{\alpha}\} {U>uα}单侧 u u u检验
σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 H 0 : μ ≥ μ 0 ↔ H 1 : μ < μ 0 H_0:\mu\ge\mu_0 \leftrightarrow H_1:\mu\lt\mu_0 H0:μμ0H1:μ<μ0 U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n (Xμ0)/σ0 { U < − u α } \{U\lt -u_{\alpha}\} {U<uα}单侧 u u u检验
σ 2 \sigma^2 σ2未知 H 0 : μ = μ 0 ↔ H 1 : μ ≠ μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\ne\mu_0 H0:μ=μ0H1:μ=μ0 T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n (Xμ0)/Sn { ∣ T ∣ > t α / 2 ( n − 1 ) } \{\mid T\mid\gt t_{\alpha/2}(n-1)\} {T>tα/2(n1)}双侧 t t t检验
σ 2 \sigma^2 σ2未知 H 0 : μ = μ 0 ↔ H 1 : μ < μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\lt\mu_0 H0:μ=μ0H1:μ<μ0 T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n (Xμ0)/Sn { T < − t α ( n − 1 ) } \{T\lt -t_{\alpha}(n-1)\} {T<tα(n1)}单侧 t t t检验
σ 2 \sigma^2 σ2未知 H 0 : μ = μ 0 ↔ H 1 : μ > μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\gt\mu_0 H0:μ=μ0H1:μ>μ0 T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n (Xμ0)/Sn { T > t α ( n − 1 ) } \{T\gt t_{\alpha}(n-1)\} {T>tα(n1)}单侧 t t t检验
σ 2 \sigma^2 σ2未知 H 0 : μ ≤ μ 0 ↔ H 1 : μ > μ 0 H_0:\mu\le\mu_0 \leftrightarrow H_1:\mu\gt\mu_0 H0:μμ0H1:μ>μ0 T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n (Xμ0)/Sn { T > t α ( n − 1 ) } \{T\gt t_{\alpha}(n-1)\} {T>tα(n1)}单侧 t t t检验
σ 2 \sigma^2 σ2未知 H 0 : μ ≥ μ 0 ↔ H 1 : μ < μ 0 H_0:\mu\ge\mu_0 \leftrightarrow H_1:\mu\lt\mu_0 H0:μμ0H1:μ<μ0 T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n (Xμ0)/Sn { T < − t α ( n − 1 ) } \{T\lt -t_{\alpha}(n-1)\} {T<tα(n1)}单侧 t t t检验

σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知时,求检验 H 0 : μ = μ 0 ↔ H 1 : μ ≠ μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\ne\mu_0 H0:μ=μ0H1:μ=μ0的拒绝域为例:

由于 X ‾ \overline X X μ \mu μ的一个很好的点估计,于是,当 H 0 H_0 H0成立,即 μ = μ 0 \mu=\mu_0 μ=μ0时, X ‾ \overline X X应该与 μ 0 \mu_0 μ0相差不多。而当 μ 1 \mu_1 μ1成立时, X ‾ \overline X X μ 0 \mu_0 μ0应相差较大。这样,可以用 ∣ X ‾ − μ 0 ∣ \mid\overline X-\mu_0\mid Xμ0的大小来反映假设,并且当 ∣ X ‾ − μ 0 ∣ > c \mid\overline X-\mu_0\mid\gt c Xμ0>c时,有理由拒绝 H 0 H_0 H0,即认为 H 1 H_1 H1成立。

因为 V a r ( X ‾ − μ 0 ) = σ 2 / n Var(\overline X-\mu_0)=\sigma^2/n Var(Xμ0)=σ2/n,为了标准化,可以取此假设的检验统计量为 U ( X ) = n ( X ‾ − μ 0 ) σ 0 (4) U(\bm X)=\frac{\sqrt n(\overline X-\mu_0)}{\sigma_0}\tag4 U(X)=σ0n (Xμ0)(4)
根据以上分析,此检验的拒绝域为 W = { x : ∣ U ( x ) ∣ > c } (5) W=\{x:\mid U(\bm x)\mid\gt c\}\tag5 W={x:U(x)>c}(5)
根据显著性水平的特点,上述拒绝域中的常数 c c c由事先给定的显著性水平 α \alpha α确定,即要求此检验犯第一类错误的概率不大于 α \alpha α,也就是说,其常数 c c c满足 P H 0 { ∣ U ( x ) ∣ > c } ≤ α (6) P_{H_0}\{\mid U(\bm x)\mid\gt c\}\le \alpha\tag6 PH0{U(x)>c}α(6)
由于当 H 0 H_0 H0成立时, U ( X ) ∼ N ( 0 , 1 ) U(\bm X)\sim N(0, 1) U(X)N(0,1),故上述拒绝域中的常数 c c c可取 c = u α / 2 c=u_{\alpha/2} c=uα/2,又因为此常数是拒绝与接受零假设的分水岭,因此称之为检验的临界值

总之,关于上述假设的显著性检验总结如下:

  • 检验统计量: U ( X ) = n ( X ‾ − μ 0 ) σ 0 (7) U(\bm X)=\frac{\sqrt n(\overline X-\mu_0)}{\sigma_0}\tag7 U(X)=σ0n (Xμ0)(7)
  • 检验的拒绝域: { x : ∣ U ( x ) ∣ > u α / 2 } (8) \{\bm x:\mid U(\bm x)\mid\gt u_{\alpha/2}\}\tag8 {x:U(x)>uα/2}(8)

与置信区间的关系

对于正态总体 N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2),当 σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知时, μ \mu μ的置信水平为 1 − α 1-\alpha 1α的置信区间为 [ X ‾ − u α / 2 σ 0 n , X ‾ + u α / 2 σ 0 n ] (9) [\overline X-u_{\alpha/2}\frac{\sigma_0}{n}, \overline X+u_{\alpha/2}\frac{\sigma_0}{n}]\tag9 [Xuα/2nσ0,X+uα/2nσ0](9)
详情见数理统计复习笔记四——区间估计
而根据式 ( 7 ) (7) (7)和式 ( 8 ) (8) (8)可知,检验的拒绝域可化为 { x : μ 0 < X ‾ − u α / 2 σ 0 n 或 μ 0 > X ‾ + u α / 2 σ 0 n } (10) \{\bm x:\mu_0\lt\overline X-u_{\alpha/2}\frac{\sigma_0}{n}或\mu_0\gt\overline X+u_{\alpha/2}\frac{\sigma_0}{n}\}\tag{10} {x:μ0<Xuα/2nσ0μ0>X+uα/2nσ0}(10)
对比式 ( 9 ) (9) (9)和式 ( 10 ) (10) (10),可以发现,接受域和置信区间有相同的形式
所以我们可以这样理解置信区间: μ 0 \mu_0 μ0落在 μ \mu μ的置信水平为 1 − α 1-\alpha 1α的置信区间时,在显著性水平 α \alpha α下,没有理由拒绝 H 0 : μ = μ 0 H_0:\mu=\mu_0 H0:μ=μ0

2.2 单样本正态总体方差的检验

均值假设检验统计量拒绝域
μ = μ 0 已 知 \mu=\mu_0已知 μ=μ0 H 0 : σ 2 = σ 0 2 ↔ H 1 : σ 2 ≠ σ 0 2 H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\ne\sigma^2_0 H0:σ2=σ02H1:σ2=σ02 χ 2 = ∑ i = 1 n ( X i − μ 0 ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0 χ2=i=1n(Xiμ0)2/σ02 { χ 2 < χ 1 − α / 2 2 ( n ) } ∪ { χ 2 > χ α / 2 2 ( n ) } \{\chi^2\lt\chi^2_{1-\alpha/2}(n)\}\cup\{\chi^2\gt\chi^2_{\alpha/2}(n)\} {χ2<χ1α/22(n)}{χ2>χα/22(n)}
μ = μ 0 \mu=\mu_0 μ=μ0已知 H 0 : σ 2 = σ 0 2 ↔ H 1 : σ 2 < σ 0 2 H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\lt\sigma^2_0 H0:σ2=σ02H1:σ2<σ02 χ 2 = ∑ i = 1 n ( X i − μ 0 ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0 χ2=i=1n(Xiμ0)2/σ02 { χ 2 < χ 1 − α / 2 2 ( n ) } \{\chi^2\lt\chi^2_{1-\alpha/2}(n)\} {χ2<χ1α/22(n)}
μ = μ 0 \mu=\mu_0 μ=μ0已知 H 0 : σ 2 = σ 0 2 ↔ H 1 : σ 2 > σ 0 2 H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\gt\sigma^2_0 H0:σ2=σ02H1:σ2>σ02 χ 2 = ∑ i = 1 n ( X i − μ 0 ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0 χ2=i=1n(Xiμ0)2/σ02 { χ 2 > χ α / 2 2 ( n ) } \{\chi^2\gt\chi^2_{\alpha/2}(n)\} {χ2>χα/22(n)}
μ = μ 0 \mu=\mu_0 μ=μ0已知 H 0 : σ 2 ≤ σ 0 2 ↔ H 1 : σ 2 > σ 0 2 H_0: \sigma^2\le\sigma^2_0\leftrightarrow H_1: \sigma^2\gt\sigma^2_0 H0:σ2σ02H1:σ2>σ02 χ 2 = ∑ i = 1 n ( X i − μ 0 ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0 χ2=i=1n(Xiμ0)2/σ02 { χ 2 > χ α / 2 2 ( n ) } \{\chi^2\gt\chi^2_{\alpha/2}(n)\} {χ2>χα/22(n)}
μ = μ 0 \mu=\mu_0 μ=μ0已知 H 0 : σ 2 ≥ σ 0 2 ↔ H 1 : σ 2 < σ 0 2 H_0: \sigma^2\ge\sigma^2_0\leftrightarrow H_1: \sigma^2\lt\sigma^2_0 H0:σ2σ02H1:σ2<σ02 χ 2 = ∑ i = 1 n ( X i − μ 0 ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0 χ2=i=1n(Xiμ0)2/σ02 { χ 2 < χ 1 − α / 2 2 ( n ) } \{\chi^2\lt\chi^2_{1-\alpha/2}(n)\} {χ2<χ1α/22(n)}
μ \mu μ未知 H 0 : σ 2 = σ 0 2 ↔ H 1 : σ 2 ≠ σ 0 2 H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\ne\sigma^2_0 H0:σ2=σ02H1:σ2=σ02 χ 2 = ∑ i = 1 n ( X i − X ‾ ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\overline X)^2/\sigma^2_0 χ2=i=1n(XiX)2/σ02 { χ 2 < χ 1 − α / 2 2 ( n − 1 ) } ∪ { χ 2 > χ α / 2 2 ( n − 1 ) } \{\chi^2\lt\chi^2_{1-\alpha/2}(n-1)\}\cup\{\chi^2\gt\chi^2_{\alpha/2}(n-1)\} {χ2<χ1α/22(n1)}{χ2>χα/22(n1)}
μ \mu μ未知 H 0 : σ 2 = σ 0 2 ↔ H 1 : σ 2 < σ 0 2 H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\lt\sigma^2_0 H0:σ2=σ02H1:σ2<σ02 χ 2 = ∑ i = 1 n ( X i − X ‾ ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\overline X)^2/\sigma^2_0 χ2=i=1n(XiX)2/σ02 { χ 2 < χ 1 − α / 2 2 ( n − 1 ) } \{\chi^2\lt\chi^2_{1-\alpha/2}(n-1)\} {χ2<χ1α/22(n1)}
μ \mu μ未知 H 0 : σ 2 = σ 0 2 ↔ H 1 : σ 2 > σ 0 2 H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\gt\sigma^2_0 H0:σ2=σ02H1:σ2>σ02 χ 2 = ∑ i = 1 n ( X i − X ‾ ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\overline X)^2/\sigma^2_0 χ2=i=1n(XiX)2/σ02 { χ 2 > χ α / 2 2 ( n − 1 ) } \{\chi^2\gt\chi^2_{\alpha/2}(n-1)\} {χ2>χα/22(n1)}
μ \mu μ未知 H 0 : σ 2 ≤ σ 0 2 ↔ H 1 : σ 2 > σ 0 2 H_0: \sigma^2\le\sigma^2_0\leftrightarrow H_1: \sigma^2\gt\sigma^2_0 H0:σ2σ02H1:σ2>σ02 χ 2 = ∑ i = 1 n ( X i − X ‾ ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\overline X)^2/\sigma^2_0 χ2=i=1n(XiX)2/σ02 { χ 2 > χ α / 2 2 ( n − 1 ) } \{\chi^2\gt\chi^2_{\alpha/2}(n-1)\} {χ2>χα/22(n1)}
μ \mu μ未知 H 0 : σ 2 ≥ σ 0 2 ↔ H 1 : σ 2 < σ 0 2 H_0: \sigma^2\ge\sigma^2_0\leftrightarrow H_1: \sigma^2\lt\sigma^2_0 H0:σ2σ02H1:σ2<σ02 χ 2 = ∑ i = 1 n ( X i − X ‾ ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\overline X)^2/\sigma^2_0 χ2=i=1n(XiX)2/σ02 { χ 2 < χ 1 − α / 2 2 ( n − 1 ) } \{\chi^2\lt\chi^2_{1-\alpha/2}(n-1)\} {χ2<χ1α/22(n1)}

μ = μ 0 \mu=\mu_0 μ=μ0时,求检验 H 0 : σ 2 = σ 0 2 ↔ H 1 : σ 2 ≠ σ 0 2 H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\ne\sigma^2_0 H0:σ2=σ02H1:σ2=σ02的拒绝域为例。

μ = μ 0 \mu=\mu_0 μ=μ0已知时, ∑ i = 1 n ( X i − μ 0 ) 2 \sum\limits_{i=1}^n(X_i-\mu_0)^2 i=1n(Xiμ0)2 σ 2 \sigma^2 σ2的一个很好的点估计,且当 H 0 H_0 H0成立时, ∑ i = 1 n ( X i − μ 0 ) 2 / σ 0 2 ∼ χ 2 ( n ) \sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0\sim \chi^2(n) i=1n(Xiμ0)2/σ02χ2(n),于是,可以选取统计量为 χ 2 = ∑ i = 1 n ( X i − μ 0 ) 2 σ 0 2 (11) \chi^2=\frac{\sum\limits_{i=1}^n(X_i-\mu_0)^2}{\sigma^2_0}\tag{11} χ2=σ02i=1n(Xiμ0)2(11)
另外,由备择假设的形式可知其拒绝域为 W = { χ 2 < c 1 } ∪ { χ 2 > c 2 } (12) W=\{\chi^2\lt c_1\}\cup\{\chi^2\gt c_2\}\tag{12} W={χ2<c1}{χ2>c2}(12)
其中, c 1 , c 2 c_1, c_2 c1,c2为两个待定的常数,且由检验的显著性水平 α \alpha α来确定,即它们满足 P H 0 { χ 2 < c 1 } + P H 0 { χ 2 > c 2 } ≤ α (13) P_{H_0}\{\chi^2\lt c_1\}+P_{H_0}\{\chi^2\gt c_2\}\le\alpha\tag{13} PH0{χ2<c1}+PH0{χ2>c2}α(13)
由于 χ 2 \chi^2 χ2分布的图像并不是对称的,所以 c 1 , c 2 c_1, c_2 c1,c2不能直接确定。于是,一个常用的方法是如下选取 c 1 , c 2 c_1, c_2 c1,c2 P H 0 { χ 2 < c 1 } ≤ α / 2 , P H 0 { χ 2 > c 2 } ≤ α / 2 (14) P_{H_0}\{\chi^2\lt c_1\}\le\alpha/2, P_{H_0}\{\chi^2\gt c_2\}\le\alpha/2\tag{14} PH0{χ2<c1}α/2,PH0{χ2>c2}α/2(14)

这样可以保证第一类错误概率为 α \alpha α的情况下,第二类错误概率最小

从而可以得到 c 1 = χ 1 − α / 2 2 ( n ) , c 2 = χ α / 2 2 ( n ) c_1=\chi^2_{1-\alpha/2}(n), c_2=\chi^2_{\alpha/2}(n) c1=χ1α/22(n),c2=χα/22(n)

三、两样本正态总体参数的显著性检验

X 1 , ⋯   , X m X_1,\cdots,X_m X1,,Xm为来自正态总体 N ( μ 1 , σ 1 2 ) N(\mu_1,\sigma^2_1) N(μ1,σ12) I I D IID IID样本, Y 1 , ⋯   , Y n Y_1,\cdots,Y_n Y1,,Yn为来自正态总体 N ( μ 2 , σ 2 2 ) N(\mu_2,\sigma^2_2) N(μ2,σ22) I I D IID IID样本,且两样本是独立的。

3.1 两样本正态总体均值的显著性检验

方差假设检验统计量拒绝域
σ 1 2 , σ 2 2 \sigma^2_1, \sigma^2_2 σ12,σ22已知 H 0 : μ 1 = μ 2 ↔ H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2\leftrightarrow H_1:\mu_1\ne\mu_2 H0:μ1=μ2H1:μ1=μ2 U = ( X ‾ − Y ‾ ) / σ 1 2 / m + σ 2 2 / n U=(\overline X-\overline Y)/\sqrt{\sigma^2_1/m+\sigma^2_2/n} U=(XY)/σ12/m+σ22/n { ∣ U ∣ > u α / 2 } \{\mid U\mid\gt u_{\alpha/2}\} {U>uα/2}
σ 1 2 , σ 2 2 \sigma^2_1, \sigma^2_2 σ12,σ22已知 H 0 : μ 1 ≤ μ 2 ↔ H 1 : μ 1 > μ 2 H_0:\mu_1\le\mu_2\leftrightarrow H_1:\mu_1\gt\mu_2 H0:μ1μ2H1:μ1>μ2 U = ( X ‾ − Y ‾ ) / σ 1 2 / m + σ 2 2 / n U=(\overline X-\overline Y)/\sqrt{\sigma^2_1/m+\sigma^2_2/n} U=(XY)/σ12/m+σ22/n { U > u α } \{U\gt u_{\alpha}\} {U>uα}
σ 1 2 , σ 2 2 \sigma^2_1, \sigma^2_2 σ12,σ22已知 H 0 : μ 1 ≥ μ 2 ↔ H 1 : μ 1 < μ 2 H_0:\mu_1\ge\mu_2\leftrightarrow H_1:\mu_1\lt\mu_2 H0:μ1μ2H1:μ1<μ2 U = ( X ‾ − Y ‾ ) / σ 1 2 / m + σ 2 2 / n U=(\overline X-\overline Y)/\sqrt{\sigma^2_1/m+\sigma^2_2/n} U=(XY)/σ12/m+σ22/n { U < − u α } \{ U\lt -u_{\alpha}\} {U<uα}
σ 1 2 = σ 2 2 \sigma^2_1=\sigma^2_2 σ12=σ22未知 H 0 : μ 1 = μ 2 ↔ H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2\leftrightarrow H_1:\mu_1\ne\mu_2 H0:μ1=μ2H1:μ1=μ2 T = m n / ( m + n ) ( X ‾ − Y ‾ ) / S m n ∗ 2 T=\sqrt{mn/(m+n)}(\overline X-\overline Y)/S_{mn}^{*2} T=mn/(m+n) (XY)/Smn2 { ∣ T ∣ > t α / 2 ( m + n − 2 ) } \{\mid T\mid\gt t_{\alpha/2}(m+n-2)\} {T>tα/2(m+n2)}
σ 1 2 = σ 2 2 \sigma^2_1=\sigma^2_2 σ12=σ22未知 H 0 : μ 1 ≤ μ 2 ↔ H 1 : μ 1 > μ 2 H_0:\mu_1\le\mu_2\leftrightarrow H_1:\mu_1\gt\mu_2 H0:μ1μ2H1:μ1>μ2 T = m n / ( m + n ) ( X ‾ − Y ‾ ) / S m n ∗ 2 T=\sqrt{mn/(m+n)}(\overline X-\overline Y)/S_{mn}^{*2} T=mn/(m+n) (XY)/Smn2 { T > t α ( m + n − 2 ) } \{T\gt t_{\alpha}(m+n-2)\} {T>tα(m+n2)}
σ 1 2 = σ 2 2 \sigma^2_1=\sigma^2_2 σ12=σ22未知 H 0 : μ 1 ≥ μ 2 ↔ H 1 : μ 1 < μ 2 H_0:\mu_1\ge\mu_2\leftrightarrow H_1:\mu_1\lt\mu_2 H0:μ1μ2H1:μ1<μ2 T = m n / ( m + n ) ( X ‾ − Y ‾ ) / S m n ∗ 2 T=\sqrt{mn/(m+n)}(\overline X-\overline Y)/S_{mn}^{*2} T=mn/(m+n) (XY)/Smn2 { T < − t α ( m + n − 2 ) } \{T\lt -t_{\alpha}(m+n-2)\} {T<tα(m+n2)}
σ 1 2 \sigma^2_1 σ12, σ 2 2 \sigma^2_2 σ22未知,且 m , n m, n m,n都比较大 H 0 : μ 1 = μ 2 ↔ H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2\leftrightarrow H_1:\mu_1\ne\mu_2 H0:μ1=μ2H1:μ1=μ2 U = ( X ‾ − Y ‾ ) / S 1 m 2 / m + S 2 n 2 / n U=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n} U=(XY)/S1m2/m+S2n2/n { ∣ U ∣ > u α / 2 } \{\mid U\mid\gt u_{\alpha/2}\} {U>uα/2}
σ 1 2 \sigma^2_1 σ12, σ 2 2 \sigma^2_2 σ22未知,且 m , n m, n m,n都比较大 H 0 : μ 1 ≤ μ 2 ↔ H 1 : μ 1 > μ 2 H_0:\mu_1\le\mu_2\leftrightarrow H_1:\mu_1\gt\mu_2 H0:μ1μ2H1:μ1>μ2 U = ( X ‾ − Y ‾ ) / S 1 m 2 / m + S 2 n 2 / n U=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n} U=(XY)/S1m2/m+S2n2/n { U > u α } \{U\gt u_{\alpha}\} {U>uα}
σ 1 2 \sigma^2_1 σ12, σ 2 2 \sigma^2_2 σ22未知,且 m , n m, n m,n都比较大 H 0 : μ 1 ≥ μ 2 ↔ H 1 : μ 1 < μ 2 H_0:\mu_1\ge\mu_2\leftrightarrow H_1:\mu_1\lt\mu_2 H0:μ1μ2H1:μ1<μ2 U = ( X ‾ − Y ‾ ) / S 1 m 2 / m + S 2 n 2 / n U=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n} U=(XY)/S1m2/m+S2n2/n { U < − u α } \{ U\lt -u_{\alpha}\} {U<uα}
σ 1 2 \sigma^2_1 σ12, σ 2 2 \sigma^2_2 σ22未知,且 m , n m, n m,n都比较小 H 0 : μ 1 = μ 2 ↔ H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2\leftrightarrow H_1:\mu_1\ne\mu_2 H0:μ1=μ2H1:μ1=μ2 T = ( X ‾ − Y ‾ ) / S 1 m 2 / m + S 2 n 2 / n T=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n} T=(XY)/S1m2/m+S2n2/n { ∣ T ∣ > t α / 2 ( r ) } \{\mid T\mid\gt t_{\alpha/2}(r)\} {T>tα/2(r)}
σ 1 2 \sigma^2_1 σ12, σ 2 2 \sigma^2_2 σ22未知,且 m , n m, n m,n都比较小 H 0 : μ 1 ≤ μ 2 ↔ H 1 : μ 1 > μ 2 H_0:\mu_1\le\mu_2\leftrightarrow H_1:\mu_1\gt\mu_2 H0:μ1μ2H1:μ1>μ2 T = ( X ‾ − Y ‾ ) / S 1 m 2 / m + S 2 n 2 / n T=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n} T=(XY)/S1m2/m+S2n2/n { T > t α ( r ) } \{T\gt t_{\alpha}(r)\} {T>tα(r)}
σ 1 2 \sigma^2_1 σ12, σ 2 2 \sigma^2_2 σ22未知,且 m , n m, n m,n都比较小 H 0 : μ 1 ≥ μ 2 ↔ H 1 : μ 1 < μ 2 H_0:\mu_1\ge\mu_2\leftrightarrow H_1:\mu_1\lt\mu_2 H0:μ1μ2H1:μ1<μ2 T = ( X ‾ − Y ‾ ) / S 1 m 2 / m + S 2 n 2 / n T=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n} T=(XY)/S1m2/m+S2n2/n { T < − t α ( r ) } \{T\lt -t_{\alpha}(r)\} {T<tα(r)}

其中, S m n ∗ 2 = ∑ i = 1 m ( X i − X ‾ ) 2 + ∑ i = 1 n ( Y i − Y ‾ ) 2 m + n (15) S_{mn}^{*2}=\frac{\sum\limits_{i=1}^m(X_i-\overline X)^2+\sum\limits_{i=1}^n(Y_i-\overline Y)^2}{m+n}\tag{15} Smn2=m+ni=1m(XiX)2+i=1n(YiY)2(15) r = S m n 4 S 1 m 4 m 2 ( m − 1 ) + S 2 n 4 n 2 ( n − 1 ) (16) r=\frac{S_{mn}^4}{\frac{S_{1m}^4}{m^2(m-1)}+\frac{S_{2n}^4}{n^2(n-1)}}\tag{16} r=m2(m1)S1m4+n2(n1)S2n4Smn4(16)
其中 S m n 2 = S 1 m 2 m + S 2 n 2 n S_{mn}^2=\frac{S_{1m}^2}{m}+\frac{S_{2n}^2}{n} Smn2=mS1m2+nS2n2

σ 1 2 = σ 2 2 \sigma^2_1=\sigma^2_2 σ12=σ22未知,求解检验 H 0 : μ 1 = μ 2 ↔ H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2\leftrightarrow H_1:\mu_1\ne\mu_2 H0:μ1=μ2H1:μ1=μ2的拒绝域为例进行说明:

由于 X ‾ \overline X X Y ‾ \overline Y Y分别是 μ 1 \mu_1 μ1 μ 2 \mu_2 μ2的一个很好的点估计,故可用 X ‾ − Y ‾ \overline X-\overline Y XY来反映 μ 1 \mu_1 μ1 μ 2 \mu_2 μ2的区别。考虑到假设的特点,我们知道,当 ∣ X ‾ − Y ‾ ∣ ≥ c \mid \overline X-\overline Y\mid\ge c XYc时,有理由拒绝 H 0 H_0 H0,其中常数 c c c由此检验犯第一类错误的概率 α \alpha α决定。

H 0 H_0 H0成立时, X ‾ − Y ‾ ∼ N ( 0 , m + n m n σ 2 ) \overline X-\overline Y\sim N(0,\frac{m+n}{mn}\sigma^2) XYN(0,mnm+nσ2),其中 σ 2 \sigma^2 σ2未知。此时可利用总的样本方差 S m n ∗ 2 = ∑ i = 1 m ( X i − X ‾ ) 2 + ∑ i = 1 n ( Y i − Y ‾ ) 2 m + n (17) S_{mn}^{*2}=\frac{\sum\limits_{i=1}^m(X_i-\overline X)^2+\sum\limits_{i=1}^n(Y_i-\overline Y)^2}{m+n}\tag{17} Smn2=m+ni=1m(XiX)2+i=1n(YiY)2(17)来估计 σ 2 \sigma^2 σ2,且在 H 0 H_0 H0成立时, ( m + n − 2 ) S m n ∗ 2 / σ 2 ∼ χ 2 ( m + n − 2 ) (m+n-2)S_{mn}^{*2}/\sigma^2\sim\chi^2(m+n-2) (m+n2)Smn2/σ2χ2(m+n2)(详情见数理统计复习笔记一——统计中常用的抽样分布(卡方分布,t分布,F分布))。

于是,一个自然的检验统计量为 T = ( X ‾ − Y ‾ ) / [ σ ( m + n ) / m n ] ( m + n − 2 ) S m n ∗ 2 / [ σ 2 ( m + n − 2 ) ] = m n m + n X ‾ − Y ‾ S m n ∗ (18) T=\frac{(\overline X-\overline Y)/[\sigma\sqrt{(m+n)/mn}]}{\sqrt{(m+n-2)S_{mn}^{*2}/[\sigma^2(m+n-2)]}}=\frac{mn}{m+n}\frac{\overline X-\overline Y}{S_{mn}^*}\tag{18} T=(m+n2)Smn2/[σ2(m+n2)] (XY)/[σ(m+n)/mn ]=m+nmnSmnXY(18)
且当 H 0 H_0 H0成立时, T ∼ t ( m + n − 2 ) T\sim t(m+n-2) Tt(m+n2),所以在显著性水平为 α \alpha α下,可以得到拒绝域为: { ∣ T ∣ > t α / 2 ( m + n − 2 ) } (19) \{\mid T\mid\gt t_{\alpha/2}(m+n-2)\}\tag{19} {T>tα/2(m+n2)}(19)

3.2 两样本正态总体方差的显著性检验

均值假设检验统计量拒绝域
μ 1 , μ 2 \mu_1, \mu_2 μ1,μ2已知 H 0 : σ 1 2 = σ 2 2 ↔ H 1 : σ 1 2 ≠ σ 2 2 H_0:\sigma_1^2=\sigma_2^2\leftrightarrow H_1:\sigma_1^2\ne\sigma_2^2 H0:σ12=σ22H1:σ12=σ22 F = ∑ i = 1 m ( X i − μ 1 ) 2 / m ∑ i = 1 n ( Y i − μ 2 ) 2 / n F=\frac{\sum\limits_{i=1}^m(X_i-\mu_1)^2/m}{\sum\limits_{i=1}^n(Y_i-\mu_2)^2/n} F=i=1n(Yiμ2)2/ni=1m(Xiμ1)2/m { F < F 1 − α / 2 ( m , n ) } ∪ { F > F α / 2 ( m , n ) } \{F\lt F_{1-\alpha/2}(m,n)\}\cup\{F\gt F_{\alpha/2}(m,n)\} {F<F1α/2(m,n)}{F>Fα/2(m,n)}
μ 1 , μ 2 \mu_1, \mu_2 μ1,μ2已知 H 0 : σ 1 2 ≤ σ 2 2 ↔ H 1 : σ 1 2 > σ 2 2 H_0:\sigma_1^2\le\sigma_2^2\leftrightarrow H_1:\sigma_1^2\gt\sigma_2^2 H0:σ12σ22H1:σ12>σ22 F = ∑ i = 1 m ( X i − μ 1 ) 2 / m ∑ i = 1 n ( Y i − μ 2 ) 2 / n F=\frac{\sum\limits_{i=1}^m(X_i-\mu_1)^2/m}{\sum\limits_{i=1}^n(Y_i-\mu_2)^2/n} F=i=1n(Yiμ2)2/ni=1m(Xiμ1)2/m { F > F α ( m , n ) } \{F\gt F_{\alpha}(m,n)\} {F>Fα(m,n)}
μ 1 , μ 2 \mu_1, \mu_2 μ1,μ2已知 H 0 : σ 1 2 ≥ σ 2 2 ↔ H 1 : σ 1 2 < σ 2 2 H_0:\sigma_1^2\ge\sigma_2^2\leftrightarrow H_1:\sigma_1^2\lt\sigma_2^2 H0:σ12σ22H1:σ12<σ22 F = ∑ i = 1 m ( X i − μ 1 ) 2 / m ∑ i = 1 n ( Y i − μ 2 ) 2 / n F=\frac{\sum\limits_{i=1}^m(X_i-\mu_1)^2/m}{\sum\limits_{i=1}^n(Y_i-\mu_2)^2/n} F=i=1n(Yiμ2)2/ni=1m(Xiμ1)2/m { F < F 1 − α ( m , n ) } \{F\lt F_{1-\alpha}(m,n)\} {F<F1α(m,n)}
μ 1 , μ 2 \mu_1, \mu_2 μ1,μ2未知 H 0 : σ 1 2 = σ 2 2 ↔ H 1 : σ 1 2 ≠ σ 2 2 H_0:\sigma_1^2=\sigma_2^2\leftrightarrow H_1:\sigma_1^2\ne\sigma_2^2 H0:σ12=σ22H1:σ12=σ22 F = ∑ i = 1 m ( X i − X ‾ ) 2 / ( m − 1 ) ∑ i = 1 n ( Y i − Y ‾ ) 2 / ( n − 1 ) F=\frac{\sum\limits_{i=1}^m(X_i-\overline X)^2/(m-1)}{\sum\limits_{i=1}^n(Y_i-\overline Y)^2/(n-1)} F=i=1n(YiY)2/(n1)i=1m(XiX)2/(m1) { F < F 1 − α / 2 ( m − 1 , n − 1 ) } ∪ { F > F α / 2 ( m − 1 , n − 1 ) } \{F\lt F_{1-\alpha/2}(m-1,n-1)\}\cup\{F\gt F_{\alpha/2}(m-1,n-1)\} {F<F1α/2(m1,n1)}{F>Fα/2(m1,n1)}
μ 1 , μ 2 \mu_1, \mu_2 μ1,μ2未知 H 0 : σ 1 2 ≤ σ 2 2 ↔ H 1 : σ 1 2 > σ 2 2 H_0:\sigma_1^2\le\sigma_2^2\leftrightarrow H_1:\sigma_1^2\gt\sigma_2^2 H0:σ12σ22H1:σ12>σ22 F = ∑ i = 1 m ( X i − X ‾ ) 2 / ( m − 1 ) ∑ i = 1 n ( Y i − Y ‾ ) 2 / ( n − 1 ) F=\frac{\sum\limits_{i=1}^m(X_i-\overline X)^2/(m-1)}{\sum\limits_{i=1}^n(Y_i-\overline Y)^2/(n-1)} F=i=1n(YiY)2/(n1)i=1m(XiX)2/(m1) { F > F α ( m − 1 , n − 1 ) } \{F\gt F_{\alpha}(m-1,n-1)\} {F>Fα(m1,n1)}
μ 1 , μ 2 \mu_1, \mu_2 μ1,μ2未知 H 0 : σ 1 2 ≥ σ 2 2 ↔ H 1 : σ 1 2 < σ 2 2 H_0:\sigma_1^2\ge\sigma_2^2\leftrightarrow H_1:\sigma_1^2\lt\sigma_2^2 H0:σ12σ22H1:σ12<σ22 F = ∑ i = 1 m ( X i − X ‾ ) 2 / ( m − 1 ) ∑ i = 1 n ( Y i − Y ‾ ) 2 / ( n − 1 ) F=\frac{\sum\limits_{i=1}^m(X_i-\overline X)^2/(m-1)}{\sum\limits_{i=1}^n(Y_i-\overline Y)^2/(n-1)} F=i=1n(YiY)2/(n1)i=1m(XiX)2/(m1) { F < F 1 − α ( m − 1 , n − 1 ) } \{F\lt F_{1-\alpha}(m-1,n-1)\} {F<F1α(m1,n1)}

四、似然比检验

4.1 相关定义

4.1.1 似然比统计量

X 1 , ⋯   , X n X_1,\cdots,X_n X1,,Xn为来自分布族 F = { f ( x , θ ) : θ ∈ Θ } \mathcal F=\{f(x,\theta):\theta\in\Theta\} F={f(x,θ):θΘ} I I D IID IID样本,对于假设 H 0 : θ ∈ Θ ↔ H 1 : θ ∈ Θ 1 = Θ − θ 0 (20) H_0:\theta\in\Theta\leftrightarrow H_1:\theta\in\Theta_1=\Theta-\theta_0\tag{20} H0:θΘH1:θΘ1=Θθ0(20)
λ ( X ) = sup ⁡ θ ∈ Θ 0 f ( X , θ ) sup ⁡ θ ∈ Θ f ( X , θ ) (21) \lambda(\bm X)=\frac{\sup\limits_{\theta\in\Theta_0}f(\bm X,\theta)}{\sup\limits_{\theta\in\Theta}f(\bm X,\theta)}\tag{21} λ(X)=θΘsupf(X,θ)θΘ0supf(X,θ)(21)
则称统计量 λ ( X ) \lambda(\bm X) λ(X)为假设 ( 20 ) (20) (20)似然比,也称为广义似然比

λ ( X ) \lambda(\bm X) λ(X)的定义不难看出,如果 λ ( X ) \lambda(\bm X) λ(X)的值很小,则说明 θ ∈ Θ 0 \theta\in\Theta_0 θΘ0的可能性要比 θ ∈ Θ \theta\in\Theta θΘ的可能性小,于是我们有理由认为 H 0 H_0 H0不成立。这样就有如下的似然比检验。

4.1.2 似然比检验

采用 ( 21 ) (21) (21)式的似然比统计量 λ ( X ) \lambda(\bm X) λ(X)作为假设 ( 20 ) (20) (20)的检验统计量,且取其拒绝域为 { λ ( x ) ≤ c } \{\lambda(\bm x)\le c\} {λ(x)c},其中临界值 c c c满足 P θ { λ ( X ) ≤ c } ≤ α , ∀ θ ∈ Θ 0 (22) P_{\theta}\{\lambda(\bm X)\le c\}\le \alpha, \forall\theta\in\Theta_0\tag{22} Pθ{λ(X)c}α,θΘ0(22)
则称此检验为显著性水平为 α \alpha α的似然比检验。

如果似然比统计量的零分布未知,则很难确定似然比检验的临界值。但如果此时存在一个统计量 T ( X ) T(\bm X) T(X)关于似然比统计量式单调的且零分布已知,则可以给出一个基于 T ( X ) T(\bm X) T(X)的显著性检验。

4.2 例子

X 1 , ⋯   , X n X_1,\cdots,X_n X1,,Xn是来自正态总体 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2) I I D IID IID样本, μ , σ 2 \mu,\sigma^2 μ,σ2均未知。试求假设 H 0 : μ = μ 0 ↔ H 1 μ ≠ μ 0 H_0:\mu=\mu_0\leftrightarrow H_1\mu\ne\mu_0 H0:μ=μ0H1μ=μ0的显著性水平为 α \alpha α的似然比检验。


此时样本分布为 f ( x , θ ) = ( 2 π σ 2 ) − n / 2 exp ⁡ [ − 1 2 σ 2 ∑ i = 1 n ( X i − μ ) 2 ] f(\bm x, \theta)=(2\pi\sigma^2)^{-n/2}\exp[-\frac{1}{2\sigma^2}\sum\limits_{i=1}^n(X_i-\mu)^2] f(x,θ)=(2πσ2)n/2exp[2σ21i=1n(Xiμ)2] Θ 0 = { ( μ 0 , σ 2 ) : σ 2 > 0 } \Theta_0=\{(\mu_0,\sigma^2):\sigma^2\gt0\} Θ0={(μ0,σ2):σ2>0} Θ = { ( μ , σ 2 ) : μ ∈ R , σ 2 > 0 } \Theta=\{(\mu,\sigma^2):\mu\in\bm R, \sigma^2\gt0\} Θ={(μ,σ2):μR,σ2>0}
则似然比统计量为 λ ( x ) = sup ⁡ θ ∈ Θ 0 f ( x , θ ) sup ⁡ θ ∈ Θ f ( x , θ ) = [ ∑ i = 1 n ( x i − x ‾ ) 2 ∑ i = 1 n ( x i − μ 0 ) 2 ] n / 2 = ( 1 + T 2 n − 1 ) − n / 2 \lambda(\bm x)=\frac{\sup\limits_{\theta\in\Theta_0}f(\bm x,\theta)}{\sup\limits_{\theta\in\Theta}f(\bm x,\theta)}=[\frac{\sum\limits_{i=1}^n(x_i-\overline x)^2}{\sum\limits_{i=1}^n(x_i-\mu_0)^2}]^{n/2}=(1+\frac{T^2}{n-1})^{-n/2} λ(x)=θΘsupf(x,θ)θΘ0supf(x,θ)=[i=1n(xiμ0)2i=1n(xix)2]n/2=(1+n1T2)n/2
其中, T = n ( x ‾ − μ 0 ) S n T=\frac{\sqrt n(\overline x-\mu_0)}{S_n} T=Snn (xμ0)
所以此时的似然比统计量与传统的 t t t统计量的平方成反比,于是,两个检验统计量的拒绝域有如下关系: { λ ( x ) ≤ c } ⇔ { ∣ T ( x ) ∣ ≥ d } (23) \{\lambda(\bm x)\le c\}\Leftrightarrow\{\mid T(\bm x)\mid\ge d\}\tag{23} {λ(x)c}{T(x)d}(23)
所以,此时的似然比检验与双侧 t t t检验完全等价

五、p值

详见杂记——假设检验中p值的理解

  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值