一、假设检验概念
假设检验是依据样本提供的有限信息对总体作出推断的统计学方法,是在对研究总体两个对立的假设之间作抉择的过程。
假设检验的核心是判断差异(总体参数和样本参数之间的差异、或者两样本参数之间的差异)是否足以通过抽样的随机性(即抽样误差)来解释。
假设检验依据的基本原理是“小概率原理”,即发生概率很小的随机事件在一次试验中是几乎不可能发生的,依据这个原理,可以做出是否拒绝原假设的决定。
二、假设检验的步骤
例1 某市抽取400名小学生进行视力干预方法研究,干预组和对照组各200人。研究前首先作基线调查,发现干预组屈光度的均数为0.34D,标准差为0.12D;对照组屈光度的均数为0.57D,标准差为0.36D。试问在基线时,干预组和对照组屈光度的总体均数有无差别?
解析:样本均数分别为-0.34D和 -0.57D ,造成这种差别的原因可能有两种:
(1)两总体均数相等 -- 样本均数不同,乃抽样误差
(2)两总体均数不相等 -- 样本均数不同,并非抽样误差
所以,我们需要验证样本均数不同是否是抽样误差导致的(需进行假设检验)
1、建立检验假设:
(1)零假设(null hypothesis),又称原假设,记为:
,干预组小学生和对照组小学生屈光度的总体均数相等。
(2)对立假设 (alternative hypothesis), 又称备择假设,记为:
,干预组小学生和对照组小学生屈光度的总体均数不等。
2、确定检验水准:
,
要尽量小,小到我们可以不在乎,通常去0.05或者是0.01
3、选择检验统计量:
分子:样本均数之差
分母:样本均数之差的标准差;两个样本均数之差的方差等于两个样本方差之和,相关定理可查看《统计学基础——两个样本均值(频率)之差的分布》。
:样本均数的差别(以其标准差为单位)
4、利用样本数据计算统计量的数值:
5、确定Ρ 值,做出推断
值:
的当前值之外的尾部面积(决策原则:
成立时, 若当前情形是不太可能(
值太小)发生的,则拒绝
)。
值的意义:在承认零假设成立的条件下,然后搜集证据推翻(拒绝)零假设,如果证据不足,则无法推翻零假设,即接受对立假设,出现“统计量当前值及更不利于零假设的数值”的概率为
,详细的解释请查看《统计推断——假设检验中 p 值的含义具体是什么?》。
规定一个“小”的概率 ,称检验水准(size of a test)。
如果,表明“不大可能”犯假阳性错误
如果,表明“颇有可能”犯假阳性错误
本例, =8.57, 查标准正态分布表, 得到
<0.001。
规定=0.05 为“小”,
<
, 拒绝
,我们说“样本均数的差异具有统计学意义” 。
可认为干预组和对照组小学生屈光度的总体均数不同。
三、假设检验和区间估计的联系
方法一:假设检验
方法二:区间估计