《实用医学统计学与SAS应用》学习笔记 | 两组数值变量资料均数比较的t检验

1. t检验的基本概念

t检验用于检验两个正态分布总体的均数是否相等,检验统计量为

8d9b8252ce09d1691fc6d7fb46bdc2c0.png

t检验的统计量可以由样本均数的z变换推导得出,服从自由度为n-1的t分布,t检验得到的P值含义如下

在原假设成立的情况下,样本统计量t值出现8242737a0e4c1e9f56e5a9747b6a9825.png的概率

t检验适用于连续型资料,用于比较两个样本均数间的差异是否具有统计学意义,应用条件是

1)当样本含量较小时,理论上要求样本来自正态分布总体

2)要求两总体方差齐同,即方差齐性

t检验的分类:

1)单个样本均数与总体均数比较的单样本t检验

2)配对设计资料的差值均数与总体均数0比较的配对t检验

3)成组设计的两样本均数差异比较的独立样本t检验

2. 样本均数与总体均数比较的t检验

t值的计算公式如下

a2b785efc62aa95471fa0c2de7fbaa7d.png

例题如下

12bcb0cc84a17140de791691e7185f89.png

3. 配对设计数值变量资料比较的t检验

配对设计的三种情况:

1)两种同质受试对象分别接受两种处理,通常做法是先按照非处理因素配成对子,同一对个体随机分配到处理组和对照组,接受不同处理

2)同一个样本用两种不同方法测量同一指标,或同一样本分别接受两种不同处理

3)将同一受试对象处理前后的结果进行比较

配对设计t检验基本思想是计算差值,原假设是差值d服从均数为0 的正态分布,所以配对设计t检验的检验统计量只需要将样本均数替换为差值d的均数即可,统计量如下

6676722da62f67b3c9d489ce660438ac.png

例题如下

d9d0c104d851df2601c912fe131f5cfa.png

4. 完全随机化设计的两组样本均数比较的t检验

完全随机化设计t检验的资料必须满足以下三个条件

1)两组样本资料均来自正态总体

2)两组样本资料来自的总体的总体方差相等,即方差齐

3)两组资料是独立的

完全随机化设计t检验的统计量如下

749736ac12f2e3e0326a940c7b3963e4.png

可以经由多个正态分布的加和性来推导出这个统计量,推导过程如下

59d57336b3dcb306c0ce9b0475b91dda.png

例题如下

1827411e21b933791bc0b73f5b6bf36b.png

如果完全随机化设计的两组资料均满足正态性,但不满足方差齐性,则选用t'检验,检验统计量如下

7d68befa334593f0ea0bcfb92e3d14a7.png

在做出统计推断时,具体有三种方法:

Satterhwaite法,对自由度进行校正,公式为

a06db224f6867029348e882648fdeb3c.png

Welch法,对自由度进行校正,公式为

27f73f199ca4d7a8155d58b68ce3a75f.png

Cochran & Cox 法,对临界值进行校正,公式为

212d817af257cebeff3689f22b2f4f34.png

7e48b49b10259cbb8406925cab36d212.png

如果任何一组不满足正态性,可以考虑用变量变换的方法,使资料满足正态性或方差齐性,然后考虑用t检验或者t'检验;或者用成组设计的两组样本分布比较的秩和检验

5. 变量变换

变量变换的目的

1)使各组资料服从正态分布,以满足方差分析和t检验的应用条件

2)使各组资料符合方差齐性要求,以满足方差分析和t检验的应用条件

3)使曲线直线化,常用于曲线拟合

对数变换,公式如下

6118618d7d403fb7d41a1713f8351a8b.png

当原始数据中有负值或零时,可以添加一个常数,保证原始值为大于0的正数,公式如下

579f2bea0e35f72818e024c0245ff92c.png

常用于:

1)服从对数正态分布的资料,通过对数变换使其满足正态分布的条件

使资料达到方差齐性的要求,特别是各样本的CV值比较接近时

用于回归拟合,使对数曲线直线化

平方根变换,公式如下

6f9fe6fed1c011736981403031265624.png

当原始数据中有负值或零时,可以添加一个常数,保证原始值为大于0的正数,公式如下

24d36390ab23e99a0822422912772f3e.png

常用于:

1)使服从泊松分布的分类资料或轻度偏态资料正态化

2)当各样本的方差与均数成正相关关系时,即均数大,方差也大,可使资料达到方差齐性的要求

倒数变换,公式如下

ce8a9a1541a55f1049bcb858ffa0ff95.png

常用于数据两端波动较大的资料,可使极端值的影响减小

平方根反正弦变换,公式如下

f60571b6e0d5313675c9298f4fef4c9b.png

常用于二项分布的率或者百分比的资料,当样本率服从二项分布,且总体率小于30%或者大于70%时,偏离正态较明显,可通过改变换使资料接近正态分布,从而达到方差齐性的要求

6. 正态性检验和方差齐性检验

正态性检验

有多种方法来检验数据是否满足正态性

1)图示法:P-P图,Q-Q图,直方图,箱线图,茎叶图,其中Q-Q图最有效,最常用

2)假设检验法:W检验,D检验,一般按照α=0.1的水准,为了降低II型错误率

W检验,也称为Shapiro-Wilk检验,适用于样本容量3≤n≤50的数据,检验统计量如下

b33b0574ce0a08c6cdcbe18eef8fd310.png

将数据按照从小到大的顺序排列好,α是按照样本容量n查询W检验的α系数表得到的系数值,当n为奇数时,n/2取(n-1)/2。

D检验,又称为Kolmogorov-Smironov检验,统计量如下

16f8a3c5d2072d23c7327332a97de2d6.png

其中D的公式如下

7cd121c393b2a60cbc22d0dc9264dbbc.png

适用于样本容量50≤n≤1000的数据

3)矩法:峰度系数,偏度系数

偏度是指分布不对称的程度和方向,用偏度系数来衡量,样本偏度系数用b1bf9d8b0cbe2c39260e493ed809e500.png表示,总体偏度系数用0642e4252ef2d3357ab76f8962d97118.png表示

峰度是指分布与正态曲线相比,峰的尖峭程度,用峰度系数来衡量, 样本峰度系数用818f71bcdc6cccba0548964f2cee0b90.png表示,总体峰度系数用5fd72e5b511167ee37015676c8485e22.png表示

总体偏度系数4644a46164e4f86b44b80d984d66a476.png , 分布对称,304a08727c86473e24648d515c5778e2.png,分布为正偏态,9ac9e41b151af8836c4bfc2660a09ce6.png,分布为负偏态

总体峰度系数39d1ef5f53cef285e715746550a065a6.png, 为正态峰,e15c1784b56efa4ab899d82ce200f3a7.png, 为尖峭峰(曲线峰度高出正态分布),f6d24e43a1a42e80f5457b9e216f84f7.png , 为平阔峰(曲线峰度低于正态分布)

只有同时满足对称和正态峰两个条件,才能认为该资料服从正态分布。

方差齐性检验:

通常用F检验,检验统计量如下

22bf71cc8ba0334e64a97c3c0ca6173b.png

即两个样本方差的比值,如果两个样本来自的总体方差相等,那么样本方差的差异仅有抽样误差引起,则F值不会偏离1太远。

·end·

—如果喜欢,快分享给你的朋友们吧—

原创不易,欢迎收藏,点赞,转发!生信知识浩瀚如海,在生信学习的道路上,让我们一起并肩作战!

本公众号深耕耘生信领域多年,具有丰富的数据分析经验,致力于提供真正有价值的数据分析服务,擅长个性化分析,欢迎有需要的老师和同学前来咨询。

  更多精彩

  写在最后

转发本文至朋友圈,后台私信截图即可加入生信交流群,和小伙伴一起学习交流。

扫描下方二维码,关注我们,解锁更多精彩内容!

1cf07b0a8022c595409467d3e3ce880d.jpeg

一个只分享干货的

生信公众号

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值