从清北男神母校学生的身高比较看两独立样本t检验~
独立样本t检验用于检验两个独立样本是否来自具有相同均值的总体,即检验两个正态分布总体的均值是否相等。
提出问题:北大、清华所有男生平均身高是否相等?
1、抽样:比如北大、清华分别抽取100名男生。
2、做出假设:假设北大、清华男生总体的平均身高相等(零假设)。用
3、基于当前零假设和当前样本,计算t score(t值),通过t值及比该数值更极端的值出现的概率来代表抽到目前这个样本及更极端的样本的概率。其计算公式如下:
其中
为什么这个公式长这样?(下面的介绍非常适合数学基础薄弱的同学理解,不想学习这部分也可以直接跳到第4点)
背后的原理是中心极限定理:从总体中抽取多个样本量(用n表示)足够大的样本,每个样本都可以计算得到一个均值,这些样本的均值分布近似正态分布。样本的均值所服从的正态分布的均值等于样本所来自的总体的均值,标准差等于总体标准差除以根号n。
用
N代表服从正态分布,
也就是说,我们用
数学上已经证明,
根据独立随机变量之差的均数计算法则:
根据独立随机变量之差的方差计算法则:
我们再回顾t值的计算公式:
此时sample mean是
因此两独立样本总体均值比较的t值计算公式如下:
即:
4. 在计算完t值之后,用之前讲过的方法判断t值及比该数值更极端的值出现的概率有多大。
首先确定样本统计量所服从的t分布对应的自由度。两样本所属总体方差相等时:自由度=n1+n2-2; 两样本所属总体方差不相等时:自由度用如下公式计算,
然后判断当前t值及比该数值更极端的值出现的概率:一次抽样之后计算得出的t值落在红色箭头范围内 → 在一次抽样中,抽中目前样本及更极端的样本的概率小于5% → 在一次抽样中,目前样本及更极端的样本不可能被抽中 → 拒绝零假设。
如下图。
5. 最后,根据目前得到的t值是否落在红色箭头的范围内,得到假设检验的结论。
如果你计算得到的z或t值落在了非红色箭头的范围内,就意味着零假设成立的前提下,目前样本是有可能被抽中的(目前的样本已经被抽中了,这是事实),也就是说零假设是符合事实的,所以我们没有理由拒绝零假设。相反,如果z或t值落在了红色箭头的范围内,就意味着零假设成立的前提下,目前的样本在一次抽样中是不可能发生的(这是违反事实的),那么你就有理由怀疑零假设的真实性,从而拒绝零假设。
注意:t检验的结果会因两样本方差是否相等而有变动(由本文提到的t值计算公式可知),因此在实现两独立样本t检验时,须先对两个样本所属总体的方差是否相等进行检验,再得出t检验结果,读者在实际操作中须注意。