UA MATH566 统计理论5 假设检验简介

最新推荐文章于 2024-08-18 19:21:42 发布

一个不愿透露姓名的孩子

最新推荐文章于 2024-08-18 19:21:42 发布

阅读量462

点赞数

分类专栏：统计学文章标签：统计学

本文链接：https://blog.csdn.net/weixin_44207974/article/details/105004002

版权

本文介绍了统计学中的假设检验，包括错误类型、拒绝域和势（power）。通过Neyman-Pearson引理解释了最强大检验的概念，并以正态分布的均值检验为例，展示了如何构造拒绝域。此外，还讨论了ROC曲线在比较不同检验势中的作用。

摘要由CSDN通过智能技术生成

这一讲根据最简单的一类假设检验介绍假设检验的思想。假设 $\theta_0,\theta_1 \in \Theta$ ，原假设和备择假设是
$H_0:\theta = \theta_0 \\ H_a:\theta = \theta_1$
我们需要根据样本来决定是拒绝原假设或者不能拒绝原假设。假设检验有可能出现两种错误，Type I error（假阳性）是在错误地拒绝了为真的原假设，Type II error（假阴性）是在原假设非真时没能拒绝原假设。记 $\alpha$ 为Type I error发生的概率， $\alpha$ 又叫显著性水平，则
$\alpha = P(reject\ H_0|\theta=\theta_0)$
记 $\beta$ 为Type II error发生的概率，
$\beta = P(accept\ H_0| \theta=\theta_1)$
称 $1-\beta$ 为检验的势（power）。记样本为 $X=\{X_1,\cdots,X_n\}$ ，定义critical region，或者说拒绝域为
$\in C \Leftrightarrow reject\ H_0$
记显著性水平 $\alpha$ 下，most powerful的拒绝域为 $C^*$ ，若对所有（显著性水平 $\alpha$ 下的）拒绝域 $C$ ：

$\alpha=P(X \in C^*|\theta=\theta_0)=P(X \in C|\theta=\theta_0)$ ，即相同的显著性水平
$\beta^* \le \beta$ ，即最大的势。其中 $\beta^*=P(X \in C^*|\theta=\theta_1)$ ， $\beta=P(X \in C|\theta=\theta_1)$

ROC曲线可以比较直观地比较不同检验的power。定义Receiving Operator Curve（ROC）为 $1-\beta$ 关于 $\alpha$ 的图像，如果某个检验的ROC曲线在其他检验的上方，则这个检验就有更大的势。
定义上面那个简单检验的似然比为
$\lambda(X) = \frac{\sup_{\{\theta=\theta_0\}} L(\theta|X)}{\sup_{\{\theta=\theta_0,\theta_1\}} L(\theta|X)} = \frac{L(\theta_0|X)}{\max\{L(\theta_0|X),L(\theta_1|X)\}}$
显然 $\lambda(X) \in [0,1]$ ，用这个统计量（似然比统计量，这个检验叫似然比检验）构造拒绝域为
$C^*=\{X:\lambda(X) \le c\}$
其中 $\in [0,1]$ ，它的选取与显著性水平相关。这个拒绝域的定义也比较合理，如果原假设的似然相比备择假设来说非常小的话，我们是应该拒绝原假设的。注意到如果 $\max\{L(\theta_0|X),L(\theta_1|X)\}=L(\theta_0|X)$ ，这个时候 $\lambda(X)=1$ ，显然不会拒绝原假设，所以对于这个简单的假设检验，一般把拒绝域写成
$C^*=\{X:\frac{L(\theta_0|X)}{L(\theta_1|X)}\le c_{\alpha}\}$