相关性分析是生物信息学中常用的分析方法,可以用来分析菌群与菌群的关联,菌群与因子的关联等等。本文使用R语言内置函数cor()计算变量之间的相关系数,并用corrplot包进行可视化。(本文测试数据为R语言内置数据集mtcars)。
计算相关性矩阵
运用R语言内置函数cor()来计算相关系数:cor(x,method=c("pearson","kendall","spearman")),其中x是数据框矩阵,而pearson,kendall和spearman是计算相关性的三种方法,函数默认为pearson。
可视化相关系数矩阵
本文使用corrplot包进行相关性矩阵的可视化,corrplot(https://github.com/taiyun/corrplot)是发表在github上的开源R包。
具体过程如下:
install.packages("corrplot") #安装corrplot包
data(mtcars) #加载数据集
mydata
head(mydata, 7) #查看数据前7行
cordata
round(cordata, 2) #保留两位小数,得到相关性矩阵
##corrplot()函数进行相关矩阵的可视化
该函数通过颜色深浅可视化显著相关程度。参数主要有:
corrplot(corr,method=c("circle","square","ellipse","number","shade","color","pie"),type=c("full"