如何简单理解建假设检验?

1 概论

假设检验的假设是关于总体的一个普遍性论断,这个检验是看从样本得出的结论能否推论到总体

假设检验的基本逻辑是基于科学哲学的一个重要论点:全称命题只能被否证而不能被证明。这个道理很简单,个案当然不足以证明一个全称命题,但是却可以否定全称命题。

研究时,我们当然不希望否证自己的研究假设,所以我们就搞个和研究假设相反的虚无假设。如果我们否证了虚无假设,就相当于我们证明了研究假设。所以假设检验就是要试图否证虚无假设,或者说拒绝虚无假设。这是第一层道理。

第二层道理和抽样分布有关。由于抽样的原因,样本并不可能绝对地否证虚无假设。在个案中,小概率事件可以等同于不可能发生的事件。如果虚无假设的小概率事件发生了,我们在这个意义上去在一定的事先约定的概率水平上去拒绝虚无假设。

其实理解起来很简单,基本原理只有两个:
1、一个命题只能证伪,不能证明为真(科学也只能证伪)
2、在一次观测中,小概率事件不可能发生。

常规来说,假设检验的套路就4步

  1. 问题是什么?
  2. 证据是什么?
  3. 判断标准是什么?
  4. 做出结论。

2 举例

为了便于理解,整合参考文献中的一个例子,如下:

我说我射击特别厉害,平均能打到8环,那么如何验证我是不是在吹牛逼呢,那就让我做几次射击看看我水平到底怎么样。

根据假设检验的套路:

1、问题是什么?问题就是要检测我能不能平均打到8环。

根据这个问题我提出来下面两个互为相反的假设。

  • 原假设:我的成绩在8环附近(>8环)。
  • 备择假设:我的成绩达不到8环。

为什么要提出2个假设呢?

正如前面所提到的,从逻辑学角度来说,如果我们能够证明某个原假设不成立,那么其对立假设(备择假设)肯定为真。对应这个例子,如果我能找到足够强的证据来否定原假设,那么我就能有效的说明原假设不成立,则备择假设成立。

2、证据是什么?

根据中心极限定理,足够多的样本数可以代表总体。所以我看打几次靶,然后统计一下我打出的环数。

根据我打靶的记录,我利用自己的统计知识,计算出了,在原假设成立的情况下,我的成绩在8环附近的概率。

3、判断标准是什么?

我作为一个8环水平的选手,射中的环数应该服从一个平均值为8的高斯分布。
但是事先说好我的原则:
1、可能我当天没吃饱饭呀、或者心情不好呀,而且也就只让我射击几次,我可能发挥不好等等的,所以你不能轻易怀疑我,如果我打7环、6环甚至4环你也不能怀疑我在吹牛
2、但是毕竟作为一个8环水平的选手,基本功还应该是在的,如果我只打出了2环,你就会怀疑我是不是在吹牛了,请注意,作为一个8环水平的选手,打出2环可是概率极低的事情

那么根据这个规则我们设置一个阈值比如3.6环(这个阈值就是临界值),如果我的成绩为2环(我的成绩是观察值),那我就是在吹牛。注意作为一个8环选手,打出小于这个阈值的概率是极低的(这个概率就是显著性水平)。
还有一种判断我是不是在吹牛的方法是,我已经打完了,计算打出小于我这个成绩的概率(这个概率是p值),如果这个概率小于显著性水平,则说明我的成绩小于于临界值,则说明我在吹牛;反之则我没吹牛。

可以这么理解这句话:p值是打出小于我这个成绩的概率,如果p值很小很小,说明我目前这个成绩已经很烂了,即发生了我打出2环的事情,这就说明了我在吹牛,可以拒绝原假设。那么如何判断我目前成绩是不是很烂呢,即如果p小于显著性水平(\alpha),说明我的成绩很烂,可以拒绝原假设“我的成绩在8环附近”

p值也可以认为是,在原假设成立的前提下,得到样本观察结果(即打出8环或者4环或者2环)出现的概率。

4、做出结论。

如果p<=\alpha,则拒绝原假设。

如果p>\alpha,则原假设成立。


3 结论

用统计的说法就是:
1、不轻易拒绝原假设。原假设即使真的成立,而观察的样本由于数量较少,观察值存在一定的波动。所以我们要给原假设一定范围的容忍度,这个容忍度要尽可能大,观察值出现在这个范围内都是可以容忍的。

2、小概率事件发生不正常。如果小概率事件还是发生了,那么就说明原假设有问题。

结合这两点,我们设置一个随机变量的区域,这个区域是偏离原假设的,并且发生在这个区域的概率很小,如果实际观察到的值还是出现在这个不太可能出现的范围内,那么我们可以拒绝原假设。

两种决定是否接受原假设的方法:

1、给定发生偏离原假设极端情况的概率(这就是显著性水平alpha),可以计算得到对应的临界值。若观察值在临界值范围内,表示出现这种现象都是比较正常的,则可接受原假设;若观察值超出临界值范围,则表示在原假设条件下出现了不太可能的现象,那么我们就怀疑原假设的成立性,则拒绝原假设。

2、给定发生偏离原假设极端情况的概率。计算出现观察值及比观察值还要偏离原假设的概率(这就是p值)。若p>alpha,则表示观察值在临界值范围内,则可接受原假设;若p<alpha,则表示观察值在临界值范围之外,则拒绝原假设。


4 参考文献

【1】假设检验的逻辑是是什么?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值