的单侧t检验_每日丁点 | 数据不满足正态分布,到底能不能用t检验

本文回顾了t检验的推导过程,重点介绍了t分布的关键特征,包括t分布的稳健性。解释了t界值表的作用,并指出即使非正态总体,大样本下样本均数近似正态分布。讨论了样本量足够的标准,以及t分布在统计实践中的应用。
摘要由CSDN通过智能技术生成

d5dfbdc95043c677cd2d9c175e990e4b.png

昨天我们谈了t检验的主要推导过程,今天我们简单回顾一下,然后重点看看t分布的几个重要的特征。

e7c8abc7df1e188c333a13408b4133f1.png
t分布的推导过程

3bb0eb675d250d271bbea041625cd731.png
t分布的重要特征

另一方面,类似我们之前讲解的正态分布,t分布曲线下面积也表示t统计量落在该区间的概率,如下图为所谓的t界值表,横标目为自由度v,纵标目为概率P,一侧尾部面积称为单侧概率,两侧尾巴面积之和称为双侧概率或双尾概率。

25ed839a98bd64bc23355e6309a158f0.png
t界值表

上表中数字表示给定的自由度v和P时,对应的t界值,

其中单侧概率的t界值表示为:

双侧概率的t界值表示为:

分别为给定的概率值(比如检验水准0.05)和自由度。

在做t检验的时候,嘴里总念叨的是要做正态性检验。没错,我们前文t分布的推导过程的的起点是样本数据应来源于正态分布。

然而,大量理论和相关的模拟实验都证明:即使从非正态总体中随机抽样,只有样本量n足够大,样本均数就近似服从正态分布,因此统计量t仍近似服从自由度为n-1的t分布。这条性质被称为t统计量的稳健性,这其实就是我们抽样分布那篇文章中强调过的:

根据中心极限定理,从均数为

,方差为
的总体中抽取样本量为n的简单随机样本,当样本量n很大时,无论总体分布形态如何,样本均数
近似服从于正态分布,表示为:

~

而当总体标准差

未知时,用样本标准差
估计,此时的样本均数
经变换后就服从t分布,所以不要求原数据X服从正态分布。

现在的问题就是,到底多大的样本量(n)标准才算足够大呢?其实这个标准并没有很难达到,在一般的现况研究,动辄成百上千的样本量面前,这个标准早就达到了,具体如下:

bc2fbb69ab20813b5421a556bbb70fb8.png
t分布的稳健性

欢迎关注微信公众号“丁点帮你”,每天帮你解决一个统计小问题,让你每天进步一丁点!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值