概率论：假设检验、显著性检验

JacksonKim

已于 2022-04-30 14:51:21 修改

阅读量7.2k

点赞数 9

分类专栏：数学文章标签：概率论

于 2021-10-16 19:12:22 首次发布

本文链接：https://blog.csdn.net/qq_40765537/article/details/120764989

版权

数学专栏收录该内容

10 篇文章

订阅专栏

一、什么是假设检验？——以双边检验为例

用大白话来讲，假设检验就是检验（判断）某个假设是否正确，并且说出这个判断出错的概率，（判断出错包括了这个假设原本是对的，你判断它是错的；或者这个假设是错的，你判断它是对的）。

这里我引用书本上的一个例子作为说明。

例1 某车间用一台包装机包装葡萄糖.袋装糖的净重是一个随机变量,它服从正态分布.当机器正常时,其均值为0.5kg,标准差为0.015kg.某日开工后为检验包装机是否正常,随机地抽取它所包装的糖9袋,称得净重(kg)

0.497 0.506 0,518 0.524 0.498 0.511 0.520 0.515 0.512

问机器是否正常?

以 $\mu$ , $\sigma$ 分别表示这一天袋装糖的净重总体X的均值和标准差.由于长期实践表明标准差比较稳定,我们就设 $\sigma$ =0.015.于是 $X~N(\mu,0.015^2)$ ,这里a未知,问题是根据样本值来判断 $\mu$ =0.5还是 $\mu$ ≠0.5.为此,我们提出两个相互对立的假设
$\begin{aligned} &H_{0}: \mu=\mu_{0}=0.5 \\ &H_{1}: \mu \neq \mu_{0} \end{aligned}$

既然假设是说总体均值等于某个值（0.5），一个很自然的想法就是抽一组样本，看样本均值和假设的总体均值相差多少。如果 $|\bar{x}-\mu _0|$ 相差很多，我们就考虑拒绝这个假设。

现在就面临了两个问题，一个是当两者相差多少时我们拒绝这个假设 $H_0$ , 当拒绝这个假设时我们所作的判断错误概率是多少（也就是假设为真我们反而拒绝了的概率是多少？，因为在检验时要给出出错的概率，别人才会相信你的检验结果）

之前我们介绍了中心极限定理

中心极限定理是说：
样本的平均值约等于总体的平均值。
不管总体是什么分布，任意一个总体的样本平均值都会围绕在总体的整体平均值周围，并且呈正态分布。

这里我们可以用上，考虑到 $H_0$ 为真时，由中心极限定理得， $\frac{\overline{X}-\mu}{\sigma / \sqrt{n}}=\frac{\overline{X}-\mu_{0}}{\sigma / \sqrt{n}} \sim N(0,1)$ 。可以看到这条式子给出了与 $|\bar{x}-\mu _0|$ 有关的一个概率分布，因此我们可以知道当 $|\bar{x}-\mu _0|$ 相差为某个数时所作判断出错的概率——我们不妨设 $\frac{\overline{X}-\mu}{\sigma / \sqrt{n}} \geq k$ 时拒绝假设 $H_0$ ，也就是 $|\overline{X}-\mu|\geq k\sigma/ \sqrt{n}$ 拒绝假设 $H_0$ , 否则就接受 $H_0$ 。

那么此时实际上 $H_0$ 为真却被拒绝的决策的概率为：

$P\{当H_0为真拒绝H_0\}=P_{\mu_{0}}\left\{\left|\frac{\overline{X}-\mu_{0}}{\sigma / \sqrt{n}}\right| \geqslant k\right\} \leq \alpha$
（同样可以固定出错的概率求相差的数，因为它的概率分布已知），这就能够回答我们上述提出的两个问题了。
并且我们希望这个误判的概率不大于 $\alpha$ ，此时我们就可以确定我们应该设定的k为多大（如下所示）。
在这里插入图片描述
一般来说，我们希望我们对假设做出的判断发生错误的概率越小越好，一般取为0.01，0.05。.数 $\alpha$ 称为显著性水平,上面 $\bar{x}与\mu _0$ 有无显著差的判断是在显著性水平 $\alpha$ 之下作出的。

统计量 $Z=\frac{\bar{X}-\mu_{0}}{\sigma / \sqrt{n}}$ 称为检验统计量。

在这里插入图片描述

二、什么是显著性检验？

由于检验法则是根据样本作出的,总有可能作出错误的决策.如上面所说的那样,在假设 $H_0$ 实际上为真时,我们可能犯拒绝 $H_0$ 的错误,称这类“弃真”的错误为第Ⅰ类错误.又当 $H_0$ 实际上不真时,我们也有可能接受 $H_0$ , 称这类“取伪”的错误为第Ⅱ类错误.

为此,在确定检验法则时,我们应尽可能使犯两类错误的概率都较小.但是,进一步讨论可知,一般来说,当样本容量固定时,若减少犯一类错误的概率,则犯另一类错误的概率往往增大.若要使犯两类错误的概率都减小,除非增加样本容量.在给定样本容量的情况下,一般来说,我们总是控制犯第I类错误的概率,使它不大于 $\alpha$ . $\alpha$ 的大小视具体情况而定,通常 $\alpha$ 取0.1,0.05,0.01,0.005等值.这种只对犯第I类错误的概率加以控制,而不考虑犯第Ⅱ类错误的概率的检验,称为显著性检验。

三、单边检验

设总体 $\sim N\left(\mu, \sigma^{2}\right)$ , $\mu$ 未知， $\sigma$ 已知， $X_1,X_2,...,X_n$ 是来自X的样本，给定显著性水平 $\alpha$ ，我们来求检验问题：
$H_0:\mu \leq \mu _0,H_1: \mu \geq \mu _0$
的拒绝域。

从严格的标准来讲，如果我们取样的样本均值大于 $\mu _0$ ，我们就会拒绝 $H_0$ ，但是这是不符合实际情况的，因为样本均值是围绕总体均值波动的，如果一次采样恰好采集到样本值都是比较大的，我们就拒绝这个假设，这是不合适的。

因此，就像前面的双边检验一样，我们允许样本均值 $\overline X$ 有在 $\mu$ 周围一定的波动。这里单边检验和双边检验所不同的是，双边检验的 $\overline X$ 在概率密度曲线的两边都不能波动得太多，因为双边检验的假设是一个点。相反，单边检测可以在 $\mu$ 左边任意地波动，而在右边不能波动地太多，因为单边检验地假设是小于等于号（如下图所示）。

通过下面的图可以更直观的看到 $\mu$ 所允许的波动范围（白色区域）以及拒绝域（黑色区域），其中左侧为双边检验，右侧为单边检验。如果 $\overline X$ 没有经过标准化，那么它服从 $N(\mu,\sigma)$ ;如果经过标准化后变成 $\frac{\bar{X}-\mu}{\sigma / \sqrt{n}}$ ，它服从 $N (0, 1)$
在这里插入图片描述
从图中可以很清楚地看到，对于单边检测来说，如果我们希望发生误判的错误率不高于 $\alpha$ , 那么我们应该在统计检验量z满足：
$\frac{\overline{X}-\mu}{\sigma / \sqrt{n}} \geq z_{\alpha}$

时拒绝假设 $H_0$ .

但是这里有一个问题，我们并不知道 $\mu$ 的具体值，但是在假设 $H_0$ 成立的情况下，我们有以下推导
$\frac{\bar{X}-\mu}{\sigma / \sqrt{n}} \geq \frac{\bar{X}-\mu _0}{\sigma / \sqrt{n}}$
此时如果 $\frac{\bar{X}-\mu _0}{\sigma / \sqrt{n}} \geq z_{\alpha}$ ,则必有 $\frac{\bar{X}-\mu}{\sigma / \sqrt{n}}\geq z_{\alpha}$ 。因此如果在假设 $H_0$ 成立的情况下，我们仍抽样发现不太支持 $H_0$ 的 $\overline{X}$ 出现，我们拒绝 $H_0$ 的理由更充分了（有点类似反证法思维）。当然这里不是完全充分，我们仍有 $\alpha$ 的概率误判。