从总体中随机抽取样本的目的_5个步骤,掌握两独立样本T检验

85a01a3cc41577a7fd18da0c9d03cef7.png

从清北男神母校学生的身高比较看两独立样本t检验~

独立样本t检验用于检验两个独立样本是否来自具有相同均值的总体,即检验两个正态分布总体的均值是否相等。

提出问题:北大、清华所有男生平均身高是否相等?

1、抽样:比如北大、清华分别抽取100名男生。

2、做出假设:假设北大、清华男生总体的平均身高相等(零假设)。

分别代表北大、清华男生总体的平均身高,那么零假设可表示为
,或
。我们一般选择判断
是否等于0。

3、基于当前零假设和当前样本,计算t score(t值),通过t值及比该数值更极端的值出现的概率来代表抽到目前这个样本及更极端的样本的概率。其计算公式如下:

2642cf5da022a939e912b52aa8c48db6.png

其中

分别为北大、清华男生
样本的均值,
分别为北大、清华男生
样本的标准差
分别为北大、清华男生样本的样本量。

为什么这个公式长这样?(下面的介绍非常适合数学基础薄弱的同学理解,不想学习这部分也可以直接跳到第4点)

背后的原理是中心极限定理:从总体中抽取多个样本量(用n表示)足够大的样本,每个样本都可以计算得到一个均值,这些样本的均值分布近似正态分布。样本的均值所服从的正态分布的均值等于样本所来自的总体的均值,标准差等于总体标准差除以根号n。

分别代表从北大、清华男生总体中抽取的多个
样本的均值,所以
是多个样本均值的集合,我们现在抽取到的这个样本所得到的均值
都分别是其中之一。根据中心极限定理,
分别服从以下分布:

a57683a799035e2bf5c714c034d5325d.png

N代表服从正态分布,

为样本均值所服从的正态分布的均值,等于样本所来自的目标总体的均值,即北大、清华男生总体的平均身高。
分别为样本所来自的目标总体的标准差,即北大、清华男生总体的标准差。

也就是说,我们用

代表了北大男生身高均值的分布,用
代表了清华男生身高均值的分布,但在本例中,我们关注的是两所学校男生身高均值的
差异,并非单纯的研究某一所学校, 所以我们还需要知道这个差异的分布有什么特征,即
的分布特征是怎样的呢?

数学上已经证明,

的分布仍为正态分布,其均数
和标准差
的计算如下:

根据独立随机变量之差的均数计算法则:

表示求均值,
未知时,用
代替。

根据独立随机变量之差的方差计算法则:

表示求方差,
表示求标准差,
未知时,用
代替。

我们再回顾t值的计算公式:

428aafef6fa6b10ed52c44d221dfbd9d.png

此时sample mean是

;true mean under null hypothesis是
,在零假设成立时
= 0;sample standard deviation / sqrt (sample size) 是

因此两独立样本总体均值比较的t值计算公式如下:

即:

4. 在计算完t值之后,用之前讲过的方法判断t值及比该数值更极端的值出现的概率有多大。

首先确定样本统计量所服从的t分布对应的自由度。两样本所属总体方差相等时:自由度=n1+n2-2; 两样本所属总体方差不相等时:自由度用如下公式计算,

c466776b0a963c59cf8f6894c9945209.png

然后判断当前t值及比该数值更极端的值出现的概率:一次抽样之后计算得出的t值落在红色箭头范围内 → 在一次抽样中,抽中目前样本及更极端的样本的概率小于5% → 在一次抽样中,目前样本及更极端的样本不可能被抽中 → 拒绝零假设。

如下图。

4e91edb296277cfbafa2e21575c43691.png
双侧检验。红色箭头所指的横轴区域表示z值/t值及更极端的值。灰色阴影部分表示z值/t值及更极端的值发生的概率,为5%

66198b10c14c7e07cae51433066286c3.png
单侧检验的两种情况。红色箭头所指的横轴区域表示z值/t值及更极端的值。灰色阴影部分表示z值/t值及更极端的值发生的概率为5%

5. 最后,根据目前得到的t值是否落在红色箭头的范围内,得到假设检验的结论。

如果你计算得到的z或t值落在了非红色箭头的范围内,就意味着零假设成立的前提下,目前样本是有可能被抽中的(目前的样本已经被抽中了,这是事实),也就是说零假设是符合事实的,所以我们没有理由拒绝零假设。相反,如果z或t值落在了红色箭头的范围内,就意味着零假设成立的前提下,目前的样本在一次抽样中是不可能发生的(这是违反事实的),那么你就有理由怀疑零假设的真实性,从而拒绝零假设。

注意:t检验的结果会因两样本方差是否相等而有变动(由本文提到的t值计算公式可知),因此在实现两独立样本t检验时,须先对两个样本所属总体的方差是否相等进行检验,再得出t检验结果,读者在实际操作中须注意。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值