假设检验

最新推荐文章于 2024-04-18 13:31:35 发布

Minouio

最新推荐文章于 2024-04-18 13:31:35 发布

阅读量1.6w

点赞数 5

分类专栏：统计知识文章标签：假设检验

原文链接：https://zhuanlan.zhihu.com/p/86178674

版权

统计知识专栏收录该内容

4 篇文章

订阅专栏

1. 假设检验的定义

假设检验是先对总体参数提出一个假设值，然后利用样本信息判断这一假设是否成立。

1.1 假设检验的假设

我们需要对结果进行假设，然后拿样本数据去验证这个假设。做假设检验时会设置两个假设：

零假设：零假设(原假设)， $H_0$ 是普遍接受的事实; 它与备选假设相反。研究人员致力于拒绝，废除或反驳零假设。研究人员提出了一个替代假设，他们认为这个假设解释了一种现象，然后努力拒绝零假设。零假设的设置一般为：等于=、大于等于>=、小于等于<=。
备选假设： $H_1$ 是统计者想要接受的假设。备选假设的设置一般为：不等于、大于>、小于<。

1.2 两种错误

通过样本数据来判断总体参数的假设是否成立，但样本时随机的，因而有可能出现小概率的错误。这种错误分两种，一种是弃真错误，另一种是取伪错误。

弃真错误：也叫第I类错误或α错误。它是指零假设实际上是真的，但通过样本估计总体后，拒绝了零假设。明显这是错误的，我们拒绝了真实的原假设，所以叫弃真错误，这个错误的概率我们记为α。这个值也是显著性水平，在假设检验之前我们会规定这个概率的大小。
取伪错误：也叫第II类错误或β错误。它是指零假设实际上假的，但通过样本估计总体后，接受了原假设。明显这是错误的，我们接受的零假设实际上是假的，所以叫取伪错误，这个错误的概率我们记为β。
为什么一般要拒绝零假设：因为零假设备被拒绝，如果出错的话，只能犯弃真错误（α错误），而犯弃真错误的概率已经被规定的显著性水平（值在假设检验前被规定）所控制了。这样对统计者来说更容易控制，将错误影响降到最小。

1.3 显著性水平

显著性水平是指当原（零）假设实际上正确时，检验统计量落在拒绝域的概率，简单理解就是犯弃真错误的概率。这个值是我们做假设检验之前统计者根据业务情况定好的。
显著性水平α越小，犯第I类错误的概率自然越小，一般取值：0.01、0.05、0.1等

1.4 检验方式

检验方式分为两种：双侧检验和单侧检验。

单侧检验：备选假设带有特定的方向性，分为两种：左侧检验和右侧检验。"<"称为左侧检验， ">"称为右侧检验。
双侧检验：备选假设没有特定的方向性，形式为“≠”这种检验假设称为双侧检验

检验统计量：据以对零假设和备选假设作出决策的某个样本统计量，称为检验统计量。

拒绝域
定义：拒绝域是由显著性水平围成的区域
拒绝域的功能主要用来判断假设检验是否拒绝零假设的。如果样本观测计算出来的检验统计量的具体数值落在拒绝域内，就拒绝零假设，否则不拒绝零假设。给定显著性水平α后，查表就可以得到具体临界值，将检验统计量与临界值进行比较，判断是否拒绝原假设。
双侧检验拒绝域：
在这里插入图片描述
左侧检验拒绝域：

右侧检验拒绝域：