知识点2 假设检验 显著水平和拒绝域的入门原理解释

笔记来源:通俗统计学原理入门5 假设检验 显著水平 significance level α 拒绝域 rejection region_哔哩哔哩_bilibili

目录

摘要

一、假设检验

二、显著水平、拒绝域和假设检验相关生活实例

1.显著水平和拒绝域

(1) 显著水平

(2) 拒绝域

2.实例应用


摘要

本文分别介绍了假设检验(Hypothesis Test)、显著性水平(Significance Level)和拒绝域(Rejection Region)

一、假设检验

我们接着知识点1的故事继续讲起,如果没有看过知识点1的小故事可以查看此专栏的知识点1中进行观看,相对清晰明了。

我们还是接着上一次的故事来讲。上一次,我们通过抽样统计,得出了大一5000名新生的高考英语平均分。现在一年时间过去了,大一新生变成了大二老生,学校里又来了新的大一新生。并且这时候,相关部门经过了一年的统计和整理,也公布了大二老生的高考英语成绩excel表

但新问题又来了,我们想知道今年大一新生的高考英语平均分,与大二老生的平均分有没有显著差别。当然,相关部门此时肯定还没有整理出大一新生的成绩单,因此我们没有大一的excel成绩表,但我们手头现在有了大二老生的excel成绩表。我们该怎么办呢?

答案:这时可以进行假设。我们假设,大一新生和大二老生的平均成绩没有显著的差别。换句话说,大一和大二的英语成绩,属于同一个总体,总体的均值都是\mu=137.41分。这样的话,我们若对大一新生进行大量反复的随机抽样的话,也将获得一个抽样分布,这个分布将和大二的抽样分布是一模一样的。

现在我们再来分析一下下图这个抽样分布。样本容量n=20,共抽了1000次样。其中,样本均值落入132分区间段的次数为0次,也可以说,有0%的概率落入132分区间段。样本均值落入133分区间段的次数为2次,也可以说,有千分之二,或0.2%的概率落入133分区间段。以此类推,1000次抽样中,样本均值有0.6%的概率落入134分区间段,7.6%的概率落入135分区间段,28.5%的概率落入137分区间段,1.1%的概率落入141分区间段,0.1%的概率落入142分区间段。

我们可以从上图看到,样本均值落入两边尖尖的尾巴区域的概率是非常低的。尾巴尖,代表着小概率的极端事件发生。那么,尾巴多尖才算尖呢?显然,频次越低,百分比越小,尾巴就越尖。频次一旦高于了某个数值,尾巴就变粗了。这个数值,也叫做临界值(critical value),是一个人为规定的数值。

例如,我们人为规定,从两边尾巴尖向中间对称轴的方向,数出5%的频次,才叫做"尖",或者叫"极端”(extreme)再往中间多数一点点,就超过5%了,就不算"极端"了。那么,两边尾巴5%,单边尾巴就是2.5%,如下图所示。

(1)现在,我们回到刚才的假设(如下图):假设大一和大二的英语成绩总体是一样的,都是(\mu=137.41分的总体。我们在大一新生中,抽样一次,得到一个样本均分134分。134分,落入了阴影部分的"极端区域"。"极端"事件发生。说明了什么呢?
这说明,我们这个假设可能有问题。

在人为规定双边尾巴5%为极端的情形下,只抽样了一次,“极端"事件便发生了,我们便有理由去拒绝H0。拒绝了H0又怎么样呢,我们便转而去接受H0的对立面H1H1的表述为:大一新生和大二老生的高考英语成绩有显著差别。H1也叫做对立假设、备择假设或Alternative Hypothesis。

所以,134分均分的这次抽样,让我们拒绝了H0,接受了H1,即,这次抽样,让我们认为"大一新生和大二老生的高考英语成绩有显著差别”。 

(2)再假如,还是在同一个H0的假设下,我们抽样得到的均分不是134分,而是136分。136分是没有落入"极端区域"的,这说明,这个抽样是符合我们H0假设的预期的。所以,在人为规定双边尾巴5%为极端的情形下,抽样一次得到均值136分,符合"大一新生和大二老生的高考英语成绩没有显著差别”的假设,因此不能拒绝H0。

上面的表述有点啰嗦。我们简化一下说法,如下图。这个双边尾巴5%,也就是每一边2.5%的阈值,是人为规定的。这个阈值水平,叫做"显著性水平",英语叫significance level,记为α。a也可以是2%,1%甚至0.1%等等,这个要看具体案例的具体分析。

例如,假如这个大学的校长比较严格,觉得α=5%太宽松了,觉得大一大二的平均分差个3分还是比较常见的,觉得才差个3分就算极端情形实在是说不过去。后来校长就说,把α=0.05紧一紧,以后,α=0.01才算极端。

那么,还是这个H0,但现在α=0.01,即人为规定双边尾巴1%,也就是单边尾巴是0.5%的情形作为极端。这时,我们就需要重新划一下抽样分布中的临界值和阴影面积了。 

二、显著水平、拒绝域和假设检验相关生活实例

1.显著水平和拒绝域

(1) 显著水平

我们简化一下说法。这个双边尾巴5%,也就是每一边2.5%的阈值,是人为规定的。这个阈值水平,叫做"显著性水平",英语叫significance level,记为α。a也可以是2%,1%甚至0.1%等等,这个要看具体案例的具体分析。

(2) 拒绝域

 下图这个阴影部分的“极端区域",在假设检验中,也叫做“拒绝域"、“否定域"或"临界域"等。
英语里叫做rejection region。上述就是假设检验的基本思路。你可能觉得过于简单或者匪夷所思。

2.实例应用

例如:我们用今年1月份的消费水平抽样,和去年的已经统计出来的全年的消费水平总体进行比较,来预测今年和去年的消费有无显著差别。再例如:我们用A城市的一个平均工资抽样,和B城市的已经统计出来的工资总体进行比较,来推测两个城市工资水平有无显著差别。等等等等。

  • 4
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值