两组间差异的非参数检验之Wilcox秩和检验在R中实现
在进行两组数据间的差异分析时,我们通常会想到使用t检验。但若数据不满足执行t检验的参数假设(例如数据分布不符合正态性,变量在本质上就严重偏倚或呈现有序关系),无法使用t检验分析时,可以考虑使用非参数的方法来完成。
就两组数据的比较而言,wilcox秩和检验(或称Mann-Whitney U检验)是常见的非参数检验方法之一。 本文简介怎样在R中进行wilcox秩和检验,以实现两组间非参数差异分析。 本文使用的作图数据的网盘链接(提取码o8lr): https://pan.baidu.com/s/1b-1INL4HFrsIOvs_0UfByw 文件“alpha.txt”为某16S细菌群落测序所获得的部分alpha多样性指数数据,包含3列信息: sample,样本名称; observed_species和shannon分别为两种类型的alpha多样性指数。 文件“group.txt”为各样本分组信息,第一列(sample)为各样本名称; 第二列(group)为各样本的分组信息。 以上使用的示例数据与前文“R语言执行两组间差异分析T检验”中的数据一致。 已知group3的shannon指数数据分布并不符合正态性,此时,若我们想比较group2和group3的shannon指数间是否存在显著差异,就不适合使用t检验(暂且不考虑对数据进行合理的转化后是否会满足t检验的参数假设),可采用非参数的方法(本文中介绍使用wilcox秩和检验)去实现。数据预处理及正态性假设检验
首先将上述两个数据表读入R中,并合并在一起,以及数据的正态分布检验。library(reshape2)
#读入文件,合