R语言执行单因素方差分析(单因素ANOVA)及多重比较
对于两组数据间的差异分析,最常见的方法就是使用T检验比较两组均值是否存在显著不同。当拓展到多组(三组及以上)时,使用T检验逐一两两比较的方法无疑是低效的,不仅仅由于需要的检验次数增多,而且发生I型错误(拒绝真)的概率也会增大。Fisher提出一种广义T检验的方法来比较三组及以上总体的均值,称为方差分析(ANOVA)。
说到ANOVA,相信大家也并不陌生,这也是在统计学中最常见的统计推断方法之一。几种常见的ANOVA包含单因素方差分析(单因素ANOVA)、单因素协方差分析(ANCOVA)、双因素方差分析(双因素ANOVA)、重复测量方差分析(重复测量ANOVA)、多元方差分析(MANOVA)等。本篇首先介绍其中最常涉及的单因素ANOVA在R语言中的实现过程,一组因子变量对应一组因变量;其它几种类型,会在后续的几篇文章中再一一阐述。
本文使用的作图数据的网盘链接(提取码z4w4):
https://pan.baidu.com/s/1J-9GsmoHuQ_CEpxeWyEQsA数据预处理
示例数据说明
我们首先将示例数据读到R中,并从中挑选部分数据作为演示。
#读入文件
soil group soil
#以 chao1 指数为例,同时将分组列转换为因子变量
chao1 chao1$site str(chao1)
head(chao1)
假设存在这么一个研究:
我们在3个地域(A、B、C)分别采集了土壤样本,即获得了3种类型的土壤,并通过16S测序,获得了每种类型土壤中细菌群落的Alpha多样性指数。我们想要得知,三种土壤环境下的细菌群落的Alpha多样性指数