1. 方差分析的基本思想和应用条件
方差分析是由英国著名统计学家R.A.Fisher首创,为纪念他,又被称为F检验。
方差分析的基本思想:
根据资料的设计类型,即变异的不同来源,将全部观察值之间的变异-总变异分解为两个或多个部分,除随机误差外,其余每个部分的变异都可用某个因素的作用来解释,通过比较不同变异来源的均方,借助F分布做出统计推断,以了解某因素对观察指标是否有影响或某因素是否有效应。
以单个处理因素完全随机设计的方差分析为例
各组样本均数各不相等,这种差异可能是由抽样误差,测量误差等随机误差造成的,也有可能是不同处理导致的作用或效果,根据这种资料类型,将样本的总变异分为两部分:
组间变异:各处理组样本均数间的变异,由处理因素导致
组内变异:各组内数据的变异,由随机误差导致
在上述公式中,各部分的变异和自由度的计算公式如下
其中
变异大小与自由度有关,将各个变异除以自由度即可得到方差分析的检验统计量
方差分析的应用条件:
各样本相互独立,均来自正态分布总体
各样本来自的总体的方差相等,即具有方差齐性
2. 完全随机设计的方差分析
在应用中需要注意备择假设是各组均数全部相等或不全相等,示例如下
在实际计算过程中,可以先计算总变异和组内变异,然后二者相减得到组间变异
3. 随机区组设计的方差分析
与单因素完全随机设计相比,在总变异中,增加了区组间变异,计算公式如下
4. 多个样本均数的两两比较
当方差分析推断出各组总体均数不等或不全相等时,意味着至少两组总体均数不同,要进一步判断是那两组,需要进行多个样本均数的两两比较,此时不能直接用t检验进行比较,因为两两比较的t检验,会导致检验水准过大,犯I型错误的概率增大。
推荐的做法是使用多重比较,可进一步分为两种情况
探索性研究,在方差分析得出多个总体均数不全相等的结论后,再进行多个均数间的两两比较,可采用SNK-q检验,Bonfferoni t检验等
在设计阶段就根据研究目的进行某些均数间的两两比较,常用于事先有明确假设的证实性研究,如多个处理组与对照组的比较,可采用Dunnett-t 检验,LSD-t检验,也可采用Bonfferoni t检验等
1)SNK-q检验
SNK(Student-Newman-Keuls)检验,也称q检验,对任意两个样本均数都进行检验,检验统计量q的计算公式如下
2)LSD-t检验
即最小显著性差异t检验,适用于某一对会某几对在专业上有特殊意义的均数间的比较,如多个处理组与对照组的比较,或某几个处理组间的比较,检验统计量t值的计算公式为
3)Dunnett 检验
适用于g-1个实验组与1个对照组的比较,检验统计量的计算公式如下
5. 析因设计的方差分析
析因设计是将两个或多个实验因素的各个水平进行全面组合的实验,能够分析各个实验因素的单独效应,主效应和因素间的交互效应。举例如下
上述试验是一个包含2因素,2水平的析因设计,2个处理因素分别为是否染毒和是否给药,对于这样一个析因设计,我们可以得到如下所示的均数差值表
基于此表,可以分析单独效应,主效应和交互效应。
单独效应:指的是其他因素水平固定,同一因素不同水平指标平均值的差别,比如
主效应:各因素各单独效应的平均值
交叉效应:因素A的各单独效应随着因素B的水平变化而变化的大小称为交互效应
两因素析因设计的总变异和自由度分解为
各部分变异的自由度计算如下
析因设计的方差分析,不仅可以分析各因素的主效应,还可以分析各因素间是否存在交互效用。
·end·
—如果喜欢,快分享给你的朋友们吧—
原创不易,欢迎收藏,点赞,转发!生信知识浩瀚如海,在生信学习的道路上,让我们一起并肩作战!
本公众号深耕耘生信领域多年,具有丰富的数据分析经验,致力于提供真正有价值的数据分析服务,擅长个性化分析,欢迎有需要的老师和同学前来咨询。
更多精彩
写在最后
转发本文至朋友圈,后台私信截图即可加入生信交流群,和小伙伴一起学习交流。
扫描下方二维码,关注我们,解锁更多精彩内容!
一个只分享干货的
生信公众号