《实用医学统计学与SAS应用》学习笔记 | 多组样本均数比较的方差分析

文章介绍了方差分析的基本思想,包括将总变异分解为组间和组内变异,以及应用条件,如样本独立、正态分布和方差齐性。讨论了完全随机设计、随机区组设计的方差分析,并强调了在均数比较时避免直接使用t检验以防止错误增加。此外,文章提到了SNK-q、Dunnett和LSD-t等多重比较方法,并介绍了析因设计如何分析因素效应和交互效应。
摘要由CSDN通过智能技术生成

1. 方差分析的基本思想和应用条件

方差分析是由英国著名统计学家R.A.Fisher首创,为纪念他,又被称为F检验。

方差分析的基本思想:

根据资料的设计类型,即变异的不同来源,将全部观察值之间的变异-总变异分解为两个或多个部分,除随机误差外,其余每个部分的变异都可用某个因素的作用来解释,通过比较不同变异来源的均方,借助F分布做出统计推断,以了解某因素对观察指标是否有影响或某因素是否有效应。

以单个处理因素完全随机设计的方差分析为例

bb8aea8f8bf7eaaa90d9a78d3d10d771.png

各组样本均数各不相等,这种差异可能是由抽样误差,测量误差等随机误差造成的,也有可能是不同处理导致的作用或效果,根据这种资料类型,将样本的总变异分为两部分:

组间变异:各处理组样本均数间的变异,由处理因素导致

组内变异:各组内数据的变异,由随机误差导致

7f4f54ed2031354a9f96cdc870318f1f.png

在上述公式中,各部分的变异和自由度的计算公式如下

95b3e2af39c9990217623c0ee7ad39cb.png

其中

c80743b728d97325e2af45a4ed77601b.png

变异大小与自由度有关,将各个变异除以自由度即可得到方差分析的检验统计量

1dea2fe82c920bf50533e41342bf9676.png

方差分析的应用条件:

各样本相互独立,均来自正态分布总体

各样本来自的总体的方差相等,即具有方差齐性

2. 完全随机设计的方差分析

在应用中需要注意备择假设是各组均数全部相等或不全相等,示例如下

1bbe9ddf911c83fd6c9f1da0cdb9618b.png

在实际计算过程中,可以先计算总变异和组内变异,然后二者相减得到组间变异

3. 随机区组设计的方差分析

与单因素完全随机设计相比,在总变异中,增加了区组间变异,计算公式如下

f7be59514da958643fb37b08da34abd3.png

4. 多个样本均数的两两比较

当方差分析推断出各组总体均数不等或不全相等时,意味着至少两组总体均数不同,要进一步判断是那两组,需要进行多个样本均数的两两比较,此时不能直接用t检验进行比较,因为两两比较的t检验,会导致检验水准过大,犯I型错误的概率增大。

推荐的做法是使用多重比较,可进一步分为两种情况

探索性研究,在方差分析得出多个总体均数不全相等的结论后,再进行多个均数间的两两比较,可采用SNK-q检验,Bonfferoni t检验等

在设计阶段就根据研究目的进行某些均数间的两两比较,常用于事先有明确假设的证实性研究,如多个处理组与对照组的比较,可采用Dunnett-t 检验,LSD-t检验,也可采用Bonfferoni t检验等

1)SNK-q检验

SNK(Student-Newman-Keuls)检验,也称q检验,对任意两个样本均数都进行检验,检验统计量q的计算公式如下

20f491f74c8a1cebd9bd2e0d3d07f05a.png

2)LSD-t检验

即最小显著性差异t检验,适用于某一对会某几对在专业上有特殊意义的均数间的比较,如多个处理组与对照组的比较,或某几个处理组间的比较,检验统计量t值的计算公式为

22185e6cff4ecaec8b81d4875b0d0566.png

3)Dunnett 检验

适用于g-1个实验组与1个对照组的比较,检验统计量的计算公式如下

e15c07179104b721cf8f1248d11d6027.png

5. 析因设计的方差分析

析因设计是将两个或多个实验因素的各个水平进行全面组合的实验,能够分析各个实验因素的单独效应,主效应和因素间的交互效应。举例如下

80c46f55ed56673052f27e98d658f2bd.png

上述试验是一个包含2因素,2水平的析因设计,2个处理因素分别为是否染毒和是否给药,对于这样一个析因设计,我们可以得到如下所示的均数差值表

555f2a3050d82dda94f161f8c83057b3.png

基于此表,可以分析单独效应,主效应和交互效应。

单独效应:指的是其他因素水平固定,同一因素不同水平指标平均值的差别,比如

7cd4b945472622713c41e4b3ffde9241.png

主效应:各因素各单独效应的平均值

0cbcc3b3fe2fb5e069ad31e9a6047b67.png

交叉效应:因素A的各单独效应随着因素B的水平变化而变化的大小称为交互效应

c85675ff4c1f9dbb4b11aad1d433a705.png

两因素析因设计的总变异和自由度分解为

54d1ca303de6f883d404c7c8a96cf924.png

各部分变异的自由度计算如下

84cc581034d9a25e18e39fc3d0c0ee94.png

析因设计的方差分析,不仅可以分析各因素的主效应,还可以分析各因素间是否存在交互效用。

·end·

—如果喜欢,快分享给你的朋友们吧—

原创不易,欢迎收藏,点赞,转发!生信知识浩瀚如海,在生信学习的道路上,让我们一起并肩作战!

本公众号深耕耘生信领域多年,具有丰富的数据分析经验,致力于提供真正有价值的数据分析服务,擅长个性化分析,欢迎有需要的老师和同学前来咨询。

  更多精彩

  写在最后

转发本文至朋友圈,后台私信截图即可加入生信交流群,和小伙伴一起学习交流。

扫描下方二维码,关注我们,解锁更多精彩内容!

c1702e0d647ab3d471d9d9de30f5e9c4.jpeg

一个只分享干货的

生信公众号

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值