统计思维(实例8)——假设检验

经典假设检验

这章解决的基本问题是,在一个样本中观察到的效应是否也会出现在更大规模的总体中。例如,在NSFG样本中,第一胎和其他胎的妊娠期长度不同,这种效应是真实反映了美国妇女的生育情况,还是偶然出现在这个样本中而已。

这个问题有几种表示方法:Fisher原假设检验、Neyman-Pearson决策理论和贝叶斯推理,大部分人在实践中使用的都是这3中方法。这里介绍这些方法的一个子集,称为经典假设检验(classical hypothesis testing)。

经典假设检验的目的是回答一个问题:“给定一个样本和一个直观效应,这个效应是偶然出现的概率为多少?”,回答这个问题的步骤如下:

  • 第一步,选择一个检验统计量(test statistic),对直观效应进行量化。

  • 第二步,定义原假设(null hypothesis)。原假设是系统的一个模型,所基于的假设是直观效应不为真。

  • 第三步,计算p值。p值是在原假设为真时,直观效应出现的概率。

  • 最后,解释结果。如果p值很低,我们称这个效应是统计显著(statistically significant)的,即不太可能偶然发生。在这种情况下,我们推断,这个效应在大规模总体中出现的可能性更大。

假设检验

本文用HypothesisTest表示一个经典假设检验结果,定义如下:

class HypothesisTest(object):
    
    def __init__(self, data):
        self.data = data
        self.MakeModel()
        self.actual = self.TestStatistic(data) 
       
    def PValue(self, iters=1000):
        self.test_stats = [self.TestStatistic(self.RunModel())                            
                            for _ in range(iters)]
        
        count = sum(1 for x in self.test_stats if x >= self.actual)        
        return count / iters   
             
    def TestStatistic(self, data):
        raise UnimplementedMethodException()
            
    
  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值