1. t检验的基本概念
t检验用于检验两个正态分布总体的均数是否相等,检验统计量为
t检验的统计量可以由样本均数的z变换推导得出,服从自由度为n-1的t分布,t检验得到的P值含义如下
在原假设成立的情况下,样本统计量t值出现的概率
t检验适用于连续型资料,用于比较两个样本均数间的差异是否具有统计学意义,应用条件是
1)当样本含量较小时,理论上要求样本来自正态分布总体
2)要求两总体方差齐同,即方差齐性
t检验的分类:
1)单个样本均数与总体均数比较的单样本t检验
2)配对设计资料的差值均数与总体均数0比较的配对t检验
3)成组设计的两样本均数差异比较的独立样本t检验
2. 样本均数与总体均数比较的t检验
t值的计算公式如下
例题如下
3. 配对设计数值变量资料比较的t检验
配对设计的三种情况:
1)两种同质受试对象分别接受两种处理,通常做法是先按照非处理因素配成对子,同一对个体随机分配到处理组和对照组,接受不同处理
2)同一个样本用两种不同方法测量同一指标,或同一样本分别接受两种不同处理
3)将同一受试对象处理前后的结果进行比较
配对设计t检验基本思想是计算差值,原假设是差值d服从均数为0 的正态分布,所以配对设计t检验的检验统计量只需要将样本均数替换为差值d的均数即可,统计量如下
例题如下
4. 完全随机化设计的两组样本均数比较的t检验
完全随机化设计t检验的资料必须满足以下三个条件
1)两组样本资料均来自正态总体
2)两组样本资料来自的总体的总体方差相等,即方差齐
3)两组资料是独立的
完全随机化设计t检验的统计量如下
可以经由多个正态分布的加和性来推导出这个统计量,推导过程如下
例题如下
如果完全随机化设计的两组资料均满足正态性,但不满足方差齐性,则选用t'检验,检验统计量如下
在做出统计推断时,具体有三种方法:
Satterhwaite法,对自由度进行校正,公式为
Welch法,对自由度进行校正,公式为
Cochran & Cox 法,对临界值进行校正,公式为
如果任何一组不满足正态性,可以考虑用变量变换的方法,使资料满足正态性或方差齐性,然后考虑用t检验或者t'检验;或者用成组设计的两组样本分布比较的秩和检验
5. 变量变换
变量变换的目的
1)使各组资料服从正态分布,以满足方差分析和t检验的应用条件
2)使各组资料符合方差齐性要求,以满足方差分析和t检验的应用条件
3)使曲线直线化,常用于曲线拟合
对数变换,公式如下
当原始数据中有负值或零时,可以添加一个常数,保证原始值为大于0的正数,公式如下
常用于:
1)服从对数正态分布的资料,通过对数变换使其满足正态分布的条件
使资料达到方差齐性的要求,特别是各样本的CV值比较接近时
用于回归拟合,使对数曲线直线化
平方根变换,公式如下
当原始数据中有负值或零时,可以添加一个常数,保证原始值为大于0的正数,公式如下
常用于:
1)使服从泊松分布的分类资料或轻度偏态资料正态化
2)当各样本的方差与均数成正相关关系时,即均数大,方差也大,可使资料达到方差齐性的要求
倒数变换,公式如下
常用于数据两端波动较大的资料,可使极端值的影响减小
平方根反正弦变换,公式如下
常用于二项分布的率或者百分比的资料,当样本率服从二项分布,且总体率小于30%或者大于70%时,偏离正态较明显,可通过改变换使资料接近正态分布,从而达到方差齐性的要求
6. 正态性检验和方差齐性检验
正态性检验
有多种方法来检验数据是否满足正态性
1)图示法:P-P图,Q-Q图,直方图,箱线图,茎叶图,其中Q-Q图最有效,最常用
2)假设检验法:W检验,D检验,一般按照α=0.1的水准,为了降低II型错误率
W检验,也称为Shapiro-Wilk检验,适用于样本容量3≤n≤50的数据,检验统计量如下
将数据按照从小到大的顺序排列好,α是按照样本容量n查询W检验的α系数表得到的系数值,当n为奇数时,n/2取(n-1)/2。
D检验,又称为Kolmogorov-Smironov检验,统计量如下
其中D的公式如下
适用于样本容量50≤n≤1000的数据
3)矩法:峰度系数,偏度系数
偏度是指分布不对称的程度和方向,用偏度系数来衡量,样本偏度系数用表示,总体偏度系数用表示
峰度是指分布与正态曲线相比,峰的尖峭程度,用峰度系数来衡量, 样本峰度系数用表示,总体峰度系数用表示
总体偏度系数 , 分布对称,,分布为正偏态,,分布为负偏态
总体峰度系数, 为正态峰,, 为尖峭峰(曲线峰度高出正态分布), , 为平阔峰(曲线峰度低于正态分布)
只有同时满足对称和正态峰两个条件,才能认为该资料服从正态分布。
方差齐性检验:
通常用F检验,检验统计量如下
即两个样本方差的比值,如果两个样本来自的总体方差相等,那么样本方差的差异仅有抽样误差引起,则F值不会偏离1太远。
·end·
—如果喜欢,快分享给你的朋友们吧—
原创不易,欢迎收藏,点赞,转发!生信知识浩瀚如海,在生信学习的道路上,让我们一起并肩作战!
本公众号深耕耘生信领域多年,具有丰富的数据分析经验,致力于提供真正有价值的数据分析服务,擅长个性化分析,欢迎有需要的老师和同学前来咨询。
更多精彩
写在最后
转发本文至朋友圈,后台私信截图即可加入生信交流群,和小伙伴一起学习交流。
扫描下方二维码,关注我们,解锁更多精彩内容!
一个只分享干货的
生信公众号