数理统计复习笔记五——假设检验之显著性检验

最新推荐文章于 2023-03-24 19:24:04 发布

米法·

最新推荐文章于 2023-03-24 19:24:04 发布

阅读量1.8k

点赞数 2

分类专栏：概率论与数理统计

本文链接：https://blog.csdn.net/TSzero/article/details/118860901

版权

概率论与数理统计专栏收录该内容

23 篇文章 19 订阅

订阅专栏

一、基本概念

在统计中，我们把需要用样本去推断“正确”与否的命题称为一个假设。当然，假设是可以关于参数的，也可以是关于分布的。

通过样本对一个假设作出“对”或“不对”的具体判断规则就称为该假设的一个检验。检验的结果若“是”，则否定该命题，就称拒绝该假设，否则就称为接受原假设。这里的拒绝和接受原假设，只是在当前样本下作出的判断，并没有从逻辑或理论上“证明”该命题正确与否。

设有样本 $X$ ，取值于样本空间 $\mathcal X$ ，且知道样本来自某一个参数分布族 $\{F(x,\theta): \theta\in\Theta\}$ ，其中 $\Theta$ 为参数空间。设 $\Theta_0\subset\Theta$ ，且 $\Theta_0\ne\varnothing$ ，则命题 $H_0:\theta\in\Theta_0$ 称为一个假设或零假设。如记 $\Theta_1=\Theta-\Theta_0$ ，则命题 $H_1:\theta\in\Theta_1$ 称为 $H_0$ 的备择假设。于是 $H_0:\theta\in\Theta_0\leftrightarrow H_1:\theta\in\Theta_1\tag1$
称为假设检验问题。

对于上述假设的检验就是指这样一个法则或策略：当有了具体的样本后，由该法则或策略就可决定是接受 $H_0$ 还是拒绝 $H_0$ ，即检验就等价于把样本空间 $\mathcal X$ 划分成两个互不相交的部分 $W$ 和 $\overline W$ ，当样本属于 $\overline W$ 时，接受 $H_0$ ；否则拒绝 $H_0$ 。于是，我们称 $W$ 为该检验的拒绝域，而 $\overline W$ 称为接受域

由于样本是随机的，所以我们有可能会做出错误的决策，即当 $\theta\in\Theta_0$ 时，样本却落入了拒绝域 $W$ ，于是采取了拒绝 $H_0$ 的错误决策，称这样的错误为第一类错误；当 $\theta\in\Theta_1$ 时，样本却落入了接受域 $\overline W$ ，于是采取了接受 $H_0$ 的错误决策，称这样的错误为第二类错误。具体可见下表：

决策	$H_0$ 为真	$H_1$ 为真
接受 $H_0$	正确	第二类错误
拒绝 $H_0$	第一类错误	正确

定义犯第一类错误的概率为 $\alpha=P\{\bm X\in W|H_0\}$
定义犯第二类错误的概率为 $\beta=P\{\bm X\in\overline W|H_1\}$
对于固定的样本容量，找不到一个检验方法，使得犯第一、二类错误的概率均达到最小

势函数：对于假设 $(1)$ 的一个检验方法 $\psi$ ，其拒绝域记作 $W$ ，则称 $\beta_\psi(\theta)=P_\theta\{\bm X\in W\}, \forall\theta\in\Theta\tag2$
为此检验的势函数。

所以当 $\theta\in\Theta_0$ 时，此检验犯第一类错误的概率等于其势函数 $\beta_\psi(\theta)$ ；而当 $\theta\in\Theta_1$ 时，检验犯第二类错误的概率等于 $1-\beta_\psi(\theta)$

显著性水平：对于检验 $\psi$ 和事先给定的 $\alpha\in(0,1)$ ，如果它满足 $P_\theta\{\bm X\in W\}\le\alpha, \forall \theta\in\Theta_0\tag3$
则称 $\alpha$ 是检验 $\psi$ 的显著性水平或水平，也称 $\psi$ 为显著性水平 $\alpha$ 的检验。即检验 $\psi$ 犯第一类错误的概率不大于 $\alpha$ .

只控制一个检验犯第一类错误的概率时，称这样的检验为显著性检验。一般情况下，求取某假设的显著性检验的步骤如下：

根据实际问题，建立统计假设 $H_0\leftrightarrow H_1$
选取一个合适的统计量 $T(\bm X)$ ，使当 $H_0$ 成立时， $T$ 的分布已知，且与参数 $\theta$ 无关（称此分布为统计量 $T$ 的零分布）
根据 $H_0$ 及 $H_1$ 的特点，确定拒绝域 $W$ 的区间形式
对于给定的显著性水平 $\alpha$ ，确定拒绝域 $W$
由样本观测值 $\bm x$ ，计算统计量 $T(\bm X)$ 的值 $T(\bm x)$ ，由 $T(\bm x)$ 是否属于 $W$ ，作出最终判断。

二、单样本正态总体参数的显著性检验

在本节中，始终假设 $X_1,\cdots,X_n$ 为来自正态总体 $N(\mu,\sigma^2)$ 的 $I I D$ 样本，且我们感兴趣的是关于 $\mu$ 和 $\sigma^2$ 的检验问题。

2.1 单样本正态总体均值的检验

方差	假设	检验统计量	拒绝域	名字
$\sigma^2=\sigma^2_0$ 已知	$H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\ne\mu_0$	$U=\sqrt n(\overline X-\mu_0)/\sigma_0$	$\{\mid U\mid\gt u_{\alpha/2}\}$	双侧 $u$ 检验
$\sigma^2=\sigma^2_0$ 已知	$H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\lt\mu_0$	$U=\sqrt n(\overline X-\mu_0)/\sigma_0$	$\{U\lt -u_{\alpha}\}$	单侧 $u$ 检验
$\sigma^2=\sigma^2_0$ 已知	$H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\gt\mu_0$	$U=\sqrt n(\overline X-\mu_0)/\sigma_0$	$\{U\gt u_{\alpha}\}$	单侧 $u$ 检验
$\sigma^2=\sigma^2_0$ 已知	$H_0:\mu\le\mu_0 \leftrightarrow H_1:\mu\gt\mu_0$	$U=\sqrt n(\overline X-\mu_0)/\sigma_0$	$\{U\gt u_{\alpha}\}$	单侧 $u$ 检验
$\sigma^2=\sigma^2_0$ 已知	$H_0:\mu\ge\mu_0 \leftrightarrow H_1:\mu\lt\mu_0$	$U=\sqrt n(\overline X-\mu_0)/\sigma_0$	$\{U\lt -u_{\alpha}\}$	单侧 $u$ 检验
$\sigma^2$ 未知	$H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\ne\mu_0$	$T=\sqrt n(\overline X-\mu_0)/S_n$	$\{\mid T\mid\gt t_{\alpha/2}(n-1)\}$	双侧 $t$ 检验
$\sigma^2$ 未知	$H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\lt\mu_0$	$T=\sqrt n(\overline X-\mu_0)/S_n$	$\{T\lt -t_{\alpha}(n-1)\}$	单侧 $t$ 检验
$\sigma^2$ 未知	$H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\gt\mu_0$	$T=\sqrt n(\overline X-\mu_0)/S_n$	$\{T\gt t_{\alpha}(n-1)\}$	单侧 $t$ 检验
$\sigma^2$ 未知	$H_0:\mu\le\mu_0 \leftrightarrow H_1:\mu\gt\mu_0$	$T=\sqrt n(\overline X-\mu_0)/S_n$	$\{T\gt t_{\alpha}(n-1)\}$	单侧 $t$ 检验
$\sigma^2$ 未知	$H_0:\mu\ge\mu_0 \leftrightarrow H_1:\mu\lt\mu_0$	$T=\sqrt n(\overline X-\mu_0)/S_n$	$\{T\lt -t_{\alpha}(n-1)\}$	单侧 $t$ 检验

以 $\sigma^2=\sigma^2_0$ 已知时，求检验 $H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\ne\mu_0$ 的拒绝域为例：

由于 $\overline X$ 是 $\mu$ 的一个很好的点估计，于是，当 $H_0$ 成立，即 $\mu=\mu_0$ 时， $\overline X$ 应该与 $\mu_0$ 相差不多。而当 $\mu_1$ 成立时， $\overline X$ 与 $\mu_0$ 应相差较大。这样，可以用 $\mid\overline X-\mu_0\mid$ 的大小来反映假设，并且当 $\mid\overline X-\mu_0\mid\gt c$ 时，有理由拒绝 $H_0$ ，即认为 $H_1$ 成立。

因为 $Var(\overline X-\mu_0)=\sigma^2/n$ ，为了标准化，可以取此假设的检验统计量为 $U(\bm X)=\frac{\sqrt n(\overline X-\mu_0)}{\sigma_0}\tag4$
根据以上分析，此检验的拒绝域为 $W=\{x:\mid U(\bm x)\mid\gt c\}\tag5$
根据显著性水平的特点，上述拒绝域中的常数 $c$ 由事先给定的显著性水平 $\alpha$ 确定，即要求此检验犯第一类错误的概率不大于 $\alpha$ ，也就是说，其常数 $c$ 满足 $P_{H_0}\{\mid U(\bm x)\mid\gt c\}\le \alpha\tag6$
由于当 $H_0$ 成立时， $U(\bm X)\sim N(0, 1)$ ，故上述拒绝域中的常数 $c$ 可取 $c=u_{\alpha/2}$ ，又因为此常数是拒绝与接受零假设的分水岭，因此称之为检验的临界值。

总之，关于上述假设的显著性检验总结如下：

检验统计量： $U(\bm X)=\frac{\sqrt n(\overline X-\mu_0)}{\sigma_0}\tag7$
检验的拒绝域： $\{\bm x:\mid U(\bm x)\mid\gt u_{\alpha/2}\}\tag8$

与置信区间的关系：

对于正态总体 $N(\mu, \sigma^2)$ ，当 $\sigma^2=\sigma^2_0$ 已知时， $\mu$ 的置信水平为 $1-\alpha$ 的置信区间为 $[\overline X-u_{\alpha/2}\frac{\sigma_0}{n}, \overline X+u_{\alpha/2}\frac{\sigma_0}{n}]\tag9$
详情见数理统计复习笔记四——区间估计
而根据式 $(7)$ 和式 $(8)$ 可知，检验的拒绝域可化为 $\{\bm x:\mu_0\lt\overline X-u_{\alpha/2}\frac{\sigma_0}{n}或\mu_0\gt\overline X+u_{\alpha/2}\frac{\sigma_0}{n}\}\tag{10}$
对比式 $(9)$ 和式 $(10)$ ，可以发现，接受域和置信区间有相同的形式。
所以我们可以这样理解置信区间：当 $\mu_0$ 落在 $\mu$ 的置信水平为 $1-\alpha$ 的置信区间时，在显著性水平 $\alpha$ 下，没有理由拒绝 $H_0:\mu=\mu_0$ 。

2.2 单样本正态总体方差的检验

均值	假设	检验统计量	拒绝域
$\mu=\mu_0已知$	$H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\ne\sigma^2_0$	$\chi^2=\sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0$	$\{\chi^2\lt\chi^2_{1-\alpha/2}(n)\}\cup\{\chi^2\gt\chi^2_{\alpha/2}(n)\}$
$\mu=\mu_0$ 已知	$H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\lt\sigma^2_0$	$\chi^2=\sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0$	$\{\chi^2\lt\chi^2_{1-\alpha/2}(n)\}$
$\mu=\mu_0$ 已知	$H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\gt\sigma^2_0$	$\chi^2=\sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0$	$\{\chi^2\gt\chi^2_{\alpha/2}(n)\}$
$\mu=\mu_0$ 已知	$H_0: \sigma^2\le\sigma^2_0\leftrightarrow H_1: \sigma^2\gt\sigma^2_0$	$\chi^2=\sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0$	$\{\chi^2\gt\chi^2_{\alpha/2}(n)\}$
$\mu=\mu_0$ 已知	$H_0: \sigma^2\ge\sigma^2_0\leftrightarrow H_1: \sigma^2\lt\sigma^2_0$	$\chi^2=\sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0$	$\{\chi^2\lt\chi^2_{1-\alpha/2}(n)\}$
$\mu$ 未知	$H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\ne\sigma^2_0$	$\chi^2=\sum\limits_{i=1}^n(X_i-\overline X)^2/\sigma^2_0$	$\{\chi^2\lt\chi^2_{1-\alpha/2}(n-1)\}\cup\{\chi^2\gt\chi^2_{\alpha/2}(n-1)\}$
$\mu$ 未知	$H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\lt\sigma^2_0$	$\chi^2=\sum\limits_{i=1}^n(X_i-\overline X)^2/\sigma^2_0$	$\{\chi^2\lt\chi^2_{1-\alpha/2}(n-1)\}$
$\mu$ 未知	$H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\gt\sigma^2_0$	$\chi^2=\sum\limits_{i=1}^n(X_i-\overline X)^2/\sigma^2_0$	$\{\chi^2\gt\chi^2_{\alpha/2}(n-1)\}$
$\mu$ 未知	$H_0: \sigma^2\le\sigma^2_0\leftrightarrow H_1: \sigma^2\gt\sigma^2_0$	$\chi^2=\sum\limits_{i=1}^n(X_i-\overline X)^2/\sigma^2_0$	$\{\chi^2\gt\chi^2_{\alpha/2}(n-1)\}$
$\mu$ 未知	$H_0: \sigma^2\ge\sigma^2_0\leftrightarrow H_1: \sigma^2\lt\sigma^2_0$	$\chi^2=\sum\limits_{i=1}^n(X_i-\overline X)^2/\sigma^2_0$	$\{\chi^2\lt\chi^2_{1-\alpha/2}(n-1)\}$

以 $\mu=\mu_0$ 时，求检验 $H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\ne\sigma^2_0$ 的拒绝域为例。

当 $\mu=\mu_0$ 已知时， $\sum\limits_{i=1}^n(X_i-\mu_0)^2$ 是 $\sigma^2$ 的一个很好的点估计，且当 $H_0$ 成立时， $\sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0\sim \chi^2(n)$ ，于是，可以选取统计量为 $\chi^2=\frac{\sum\limits_{i=1}^n(X_i-\mu_0)^2}{\sigma^2_0}\tag{11}$
另外，由备择假设的形式可知其拒绝域为 $W=\{\chi^2\lt c_1\}\cup\{\chi^2\gt c_2\}\tag{12}$
其中， $c_1, c_2$ 为两个待定的常数，且由检验的显著性水平 $\alpha$ 来确定，即它们满足 $P_{H_0}\{\chi^2\lt c_1\}+P_{H_0}\{\chi^2\gt c_2\}\le\alpha\tag{13}$
由于 $\chi^2$ 分布的图像并不是对称的，所以 $c_1, c_2$ 不能直接确定。于是，一个常用的方法是如下选取 $c_1, c_2$ ， $P_{H_0}\{\chi^2\lt c_1\}\le\alpha/2, P_{H_0}\{\chi^2\gt c_2\}\le\alpha/2\tag{14}$

这样可以保证第一类错误概率为 $\alpha$ 的情况下，第二类错误概率最小

从而可以得到 $c_1=\chi^2_{1-\alpha/2}(n), c_2=\chi^2_{\alpha/2}(n)$

三、两样本正态总体参数的显著性检验

设 $X_1,\cdots,X_m$ 为来自正态总体 $N(\mu_1,\sigma^2_1)$ 的 $I I D$ 样本， $Y_1,\cdots,Y_n$ 为来自正态总体 $N(\mu_2,\sigma^2_2)$ 的 $I I D$ 样本，且两样本是独立的。

3.1 两样本正态总体均值的显著性检验

方差	假设	检验统计量	拒绝域
$\sigma^2_1, \sigma^2_2$ 已知	$H_0:\mu_1=\mu_2\leftrightarrow H_1:\mu_1\ne\mu_2$	$U=(\overline X-\overline Y)/\sqrt{\sigma^2_1/m+\sigma^2_2/n}$	$\{\mid U\mid\gt u_{\alpha/2}\}$
$\sigma^2_1, \sigma^2_2$ 已知	$H_0:\mu_1\le\mu_2\leftrightarrow H_1:\mu_1\gt\mu_2$	$U=(\overline X-\overline Y)/\sqrt{\sigma^2_1/m+\sigma^2_2/n}$	$\{U\gt u_{\alpha}\}$
$\sigma^2_1, \sigma^2_2$ 已知	$H_0:\mu_1\ge\mu_2\leftrightarrow H_1:\mu_1\lt\mu_2$	$U=(\overline X-\overline Y)/\sqrt{\sigma^2_1/m+\sigma^2_2/n}$	$\{ U\lt -u_{\alpha}\}$
$\sigma^2_1=\sigma^2_2$ 未知	$H_0:\mu_1=\mu_2\leftrightarrow H_1:\mu_1\ne\mu_2$	$T=\sqrt{mn/(m+n)}(\overline X-\overline Y)/S_{mn}^{*2}$	$\{\mid T\mid\gt t_{\alpha/2}(m+n-2)\}$
$\sigma^2_1=\sigma^2_2$ 未知	$H_0:\mu_1\le\mu_2\leftrightarrow H_1:\mu_1\gt\mu_2$	$T=\sqrt{mn/(m+n)}(\overline X-\overline Y)/S_{mn}^{*2}$	$\{T\gt t_{\alpha}(m+n-2)\}$
$\sigma^2_1=\sigma^2_2$ 未知	$H_0:\mu_1\ge\mu_2\leftrightarrow H_1:\mu_1\lt\mu_2$	$T=\sqrt{mn/(m+n)}(\overline X-\overline Y)/S_{mn}^{*2}$	$\{T\lt -t_{\alpha}(m+n-2)\}$
$\sigma^2_1$ , $\sigma^2_2$ 未知，且 $m, n$ 都比较大	$H_0:\mu_1=\mu_2\leftrightarrow H_1:\mu_1\ne\mu_2$	$U=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n}$	$\{\mid U\mid\gt u_{\alpha/2}\}$
$\sigma^2_1$ , $\sigma^2_2$ 未知，且 $m, n$ 都比较大	$H_0:\mu_1\le\mu_2\leftrightarrow H_1:\mu_1\gt\mu_2$	$U=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n}$	$\{U\gt u_{\alpha}\}$
$\sigma^2_1$ , $\sigma^2_2$ 未知，且 $m, n$ 都比较大	$H_0:\mu_1\ge\mu_2\leftrightarrow H_1:\mu_1\lt\mu_2$	$U=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n}$	$\{ U\lt -u_{\alpha}\}$
$\sigma^2_1$ , $\sigma^2_2$ 未知，且 $m, n$ 都比较小	$H_0:\mu_1=\mu_2\leftrightarrow H_1:\mu_1\ne\mu_2$	$T=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n}$	$\{\mid T\mid\gt t_{\alpha/2}(r)\}$
$\sigma^2_1$ , $\sigma^2_2$ 未知，且 $m, n$ 都比较小	$H_0:\mu_1\le\mu_2\leftrightarrow H_1:\mu_1\gt\mu_2$	$T=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n}$	$\{T\gt t_{\alpha}(r)\}$
$\sigma^2_1$ , $\sigma^2_2$ 未知，且 $m, n$ 都比较小	$H_0:\mu_1\ge\mu_2\leftrightarrow H_1:\mu_1\lt\mu_2$	$T=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n}$	$\{T\lt -t_{\alpha}(r)\}$

其中， $S_{mn}^{*2}=\frac{\sum\limits_{i=1}^m(X_i-\overline X)^2+\sum\limits_{i=1}^n(Y_i-\overline Y)^2}{m+n}\tag{15}$ $r=\frac{S_{mn}^4}{\frac{S_{1m}^4}{m^2(m-1)}+\frac{S_{2n}^4}{n^2(n-1)}}\tag{16}$
其中 $S_{mn}^2=\frac{S_{1m}^2}{m}+\frac{S_{2n}^2}{n}$

以 $\sigma^2_1=\sigma^2_2$ 未知，求解检验 $H_0:\mu_1=\mu_2\leftrightarrow H_1:\mu_1\ne\mu_2$ 的拒绝域为例进行说明：

由于 $\overline X$ ， $\overline Y$ 分别是 $\mu_1$ ， $\mu_2$ 的一个很好的点估计，故可用 $\overline X-\overline Y$ 来反映 $\mu_1$ 和 $\mu_2$ 的区别。考虑到假设的特点，我们知道，当 $\mid \overline X-\overline Y\mid\ge c$ 时，有理由拒绝 $H_0$ ，其中常数 $c$ 由此检验犯第一类错误的概率 $\alpha$ 决定。

当 $H_0$ 成立时， $\overline X-\overline Y\sim N(0,\frac{m+n}{mn}\sigma^2)$ ，其中 $\sigma^2$ 未知。此时可利用总的样本方差 $S_{mn}^{*2}=\frac{\sum\limits_{i=1}^m(X_i-\overline X)^2+\sum\limits_{i=1}^n(Y_i-\overline Y)^2}{m+n}\tag{17}$ 来估计 $\sigma^2$ ，且在 $H_0$ 成立时， $(m+n-2)S_{mn}^{*2}/\sigma^2\sim\chi^2(m+n-2)$ （详情见数理统计复习笔记一——统计中常用的抽样分布(卡方分布，t分布，F分布)）。

于是，一个自然的检验统计量为 $T=\frac{(\overline X-\overline Y)/[\sigma\sqrt{(m+n)/mn}]}{\sqrt{(m+n-2)S_{mn}^{*2}/[\sigma^2(m+n-2)]}}=\frac{mn}{m+n}\frac{\overline X-\overline Y}{S_{mn}^*}\tag{18}$
且当 $H_0$ 成立时， $T\sim t(m+n-2)$ ，所以在显著性水平为 $\alpha$ 下，可以得到拒绝域为： $\{\mid T\mid\gt t_{\alpha/2}(m+n-2)\}\tag{19}$

3.2 两样本正态总体方差的显著性检验

均值	假设	检验统计量	拒绝域
$\mu_1, \mu_2$ 已知	$H_0:\sigma_1^2=\sigma_2^2\leftrightarrow H_1:\sigma_1^2\ne\sigma_2^2$	$F=\frac{\sum\limits_{i=1}^m(X_i-\mu_1)^2/m}{\sum\limits_{i=1}^n(Y_i-\mu_2)^2/n}$	$\{F\lt F_{1-\alpha/2}(m,n)\}\cup\{F\gt F_{\alpha/2}(m,n)\}$
$\mu_1, \mu_2$ 已知	$H_0:\sigma_1^2\le\sigma_2^2\leftrightarrow H_1:\sigma_1^2\gt\sigma_2^2$	$F=\frac{\sum\limits_{i=1}^m(X_i-\mu_1)^2/m}{\sum\limits_{i=1}^n(Y_i-\mu_2)^2/n}$	$\{F\gt F_{\alpha}(m,n)\}$
$\mu_1, \mu_2$ 已知	$H_0:\sigma_1^2\ge\sigma_2^2\leftrightarrow H_1:\sigma_1^2\lt\sigma_2^2$	$F=\frac{\sum\limits_{i=1}^m(X_i-\mu_1)^2/m}{\sum\limits_{i=1}^n(Y_i-\mu_2)^2/n}$	$\{F\lt F_{1-\alpha}(m,n)\}$
$\mu_1, \mu_2$ 未知	$H_0:\sigma_1^2=\sigma_2^2\leftrightarrow H_1:\sigma_1^2\ne\sigma_2^2$	$F=\frac{\sum\limits_{i=1}^m(X_i-\overline X)^2/(m-1)}{\sum\limits_{i=1}^n(Y_i-\overline Y)^2/(n-1)}$	$\{F\lt F_{1-\alpha/2}(m-1,n-1)\}\cup\{F\gt F_{\alpha/2}(m-1,n-1)\}$
$\mu_1, \mu_2$ 未知	$H_0:\sigma_1^2\le\sigma_2^2\leftrightarrow H_1:\sigma_1^2\gt\sigma_2^2$	$F=\frac{\sum\limits_{i=1}^m(X_i-\overline X)^2/(m-1)}{\sum\limits_{i=1}^n(Y_i-\overline Y)^2/(n-1)}$	$\{F\gt F_{\alpha}(m-1,n-1)\}$
$\mu_1, \mu_2$ 未知	$H_0:\sigma_1^2\ge\sigma_2^2\leftrightarrow H_1:\sigma_1^2\lt\sigma_2^2$	$F=\frac{\sum\limits_{i=1}^m(X_i-\overline X)^2/(m-1)}{\sum\limits_{i=1}^n(Y_i-\overline Y)^2/(n-1)}$	$\{F\lt F_{1-\alpha}(m-1,n-1)\}$

四、似然比检验

4.1 相关定义

4.1.1 似然比统计量

设 $X_1,\cdots,X_n$ 为来自分布族 $\mathcal F=\{f(x,\theta):\theta\in\Theta\}$ 的 $I I D$ 样本，对于假设 $H_0:\theta\in\Theta\leftrightarrow H_1:\theta\in\Theta_1=\Theta-\theta_0\tag{20}$
令 $\lambda(\bm X)=\frac{\sup\limits_{\theta\in\Theta_0}f(\bm X,\theta)}{\sup\limits_{\theta\in\Theta}f(\bm X,\theta)}\tag{21}$
则称统计量 $\lambda(\bm X)$ 为假设 $(20)$ 的似然比，也称为广义似然比

从 $\lambda(\bm X)$ 的定义不难看出，如果 $\lambda(\bm X)$ 的值很小，则说明 $\theta\in\Theta_0$ 的可能性要比 $\theta\in\Theta$ 的可能性小，于是我们有理由认为 $H_0$ 不成立。这样就有如下的似然比检验。

4.1.2 似然比检验

采用 $(21)$ 式的似然比统计量 $\lambda(\bm X)$ 作为假设 $(20)$ 的检验统计量，且取其拒绝域为 $\{\lambda(\bm x)\le c\}$ ，其中临界值 $c$ 满足 $P_{\theta}\{\lambda(\bm X)\le c\}\le \alpha, \forall\theta\in\Theta_0\tag{22}$
则称此检验为显著性水平为 $\alpha$ 的似然比检验。

如果似然比统计量的零分布未知，则很难确定似然比检验的临界值。但如果此时存在一个统计量 $T(\bm X)$ 关于似然比统计量式单调的且零分布已知，则可以给出一个基于 $T(\bm X)$ 的显著性检验。

4.2 例子

设 $X_1,\cdots,X_n$ 是来自正态总体 $N(\mu,\sigma^2)$ 的 $I I D$ 样本， $\mu,\sigma^2$ 均未知。试求假设 $H_0:\mu=\mu_0\leftrightarrow H_1\mu\ne\mu_0$ 的显著性水平为 $\alpha$ 的似然比检验。

解：
此时样本分布为 $f(\bm x, \theta)=(2\pi\sigma^2)^{-n/2}\exp[-\frac{1}{2\sigma^2}\sum\limits_{i=1}^n(X_i-\mu)^2]$ ， $\Theta_0=\{(\mu_0,\sigma^2):\sigma^2\gt0\}$ ， $\Theta=\{(\mu,\sigma^2):\mu\in\bm R, \sigma^2\gt0\}$
则似然比统计量为 $\lambda(\bm x)=\frac{\sup\limits_{\theta\in\Theta_0}f(\bm x,\theta)}{\sup\limits_{\theta\in\Theta}f(\bm x,\theta)}=[\frac{\sum\limits_{i=1}^n(x_i-\overline x)^2}{\sum\limits_{i=1}^n(x_i-\mu_0)^2}]^{n/2}=(1+\frac{T^2}{n-1})^{-n/2}$
其中， $T=\frac{\sqrt n(\overline x-\mu_0)}{S_n}$
所以此时的似然比统计量与传统的 $t$ 统计量的平方成反比，于是，两个检验统计量的拒绝域有如下关系： $\{\lambda(\bm x)\le c\}\Leftrightarrow\{\mid T(\bm x)\mid\ge d\}\tag{23}$
所以，此时的似然比检验与双侧 $t$ 检验完全等价

五、p值

详见杂记——假设检验中p值的理解

米法·

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
数理统计复习笔记五——假设检验之显著性检验

一、基本概念在统计中，我们把需要用样本去推断“正确”与否的命题称为一个假设。当然，假设是可以关于参数的，也可以是关于分布的。通过样本对一个假设作出“对”或“不对”的具体判断规则就称为该假设的一个检验。检验的结果若“是”，则否定该命题，就称拒绝该假设，否则就称为接受原假设。这里的拒绝和接受原假设，只是在当前样本下作出的判断，并没有从逻辑或理论上“证明”该命题正确与否。设有样本XXX，取值于样本空间X\mathcal XX，且知道样本来自某一个参数分布族{F(x,θ):θ∈Θ}\{F(x,\theta):
复制链接

扫一扫

专栏目录