导读
非加权组平均法(unweighted pair-group method with arithmetic means, UPGMA或average linkage)是一种较常用的聚类分析方法,可用于分析分类问题,也常被用于微生物多样性研究。下面介绍用R语言中的UPGMA函数分析微生物多样性数据和结果可视化的方法,内容如下:1)模拟(样品、丰度)矩阵数据;2)计算bray curtis相异指数和UPGMA聚类;3)绘制树状图。
1 模拟(样品、丰度)矩阵数据
set.seed(1995)
# 随机种子
data=matrix(abs(round(rnorm(200, mean=1000, sd=500))), 20, 10)
# 随机正整数,20行,20列
colnames(data)=paste("Species", 1:10, sep=".")
# 列名-细菌
rownames(data)=paste("Sample", 1:20, sep=".")
# 行名-样品
data_norm=data
for(i in 1:20){
sample_sum=apply(data, 1, sum)
for(j in 1:10){
data_norm[i,j]=data[i,j]/sample_sum[i]
}
}
# 标准化
data_norm
# 模拟完成的标准化矩阵数据如下:
Species.1 Species.2 Specie