mcem r语言代码_几行R语言代码搞定菌群与环境因子或临床指标相关性的可视化...

本文介绍了如何使用R语言进行相关性分析,通过内置函数cor()计算相关系数,并利用corrplot包对相关性矩阵进行可视化。示例中展示了corrplot的不同参数设置,如矩阵类型、图形形状、排序方式等,帮助理解相关性分析和可视化的过程。
摘要由CSDN通过智能技术生成
1421e114d5624a59d53170b4aff25c72.png

相关性分析是生物信息学中常用的分析方法,可以用来分析菌群与菌群的关联,菌群与因子的关联等等。本文使用R语言内置函数cor()计算变量之间的相关系数,并用corrplot包进行可视化。(本文测试数据为R语言内置数据集mtcars)。

计算相关性矩阵

运用R语言内置函数cor()来计算相关系数:cor(x,method=c("pearson","kendall","spearman")),其中x是数据框矩阵,而pearson,kendall和spearman是计算相关性的三种方法,函数默认为pearson。

可视化相关系数矩阵

本文使用corrplot包进行相关性矩阵的可视化,corrplot(https://github.com/taiyun/corrplot)是发表在github上的开源R包。

具体过程如下:

install.packages("corrplot")  #安装corrplot包

data(mtcars)  #加载数据集

mydata

head(mydata, 7)  #查看数据前7行

270310dd4caeaed5b829d338f2a2bb02.png

cordata  #函数cor计算相关性

round(cordata, 2)  #保留两位小数,得到相关性矩阵

cb5ee0cf9c04afab5d18f9e9ca5c662e.png

##corrplot()函数进行相关矩阵的可视化

该函数通过颜色深浅可视化显著相关程度。参数主要有:

corrplot(corr,method=c("circle","square","ellipse","number","shade","color","pie"),type=c("full","lower","upper"),order=c("original","AOE","FPC","hclust","alphabet"),tl.cex=1,tl.col="red",order=c("original","AOE","FPC","hclust","alphabet"),hclust.method=c("complete","ward","ward.D","ward.D2","single","average","mcquitty","median","centroid"),tl.cex = 1,tl.col="red",...)

bf3dff677930f8b979e420c8d92a034e.png

接下来简单介绍几个参数用法及展示其可视化:

fbd1ba5e4d6f91cb8b8018ea468bc2e3.png

1.矩阵类型,通过type参数,“upper”,“lower”, “full”,分别显示上三角,下三角还是全部。

corrplot(cordata, type="lower")  #下三角矩阵

b3b871020b19200a2c0a3f1cc677aa68.png

corrplot(cordata, type="full",method="circle")  #全矩阵

ee1788c1c8b40474ae29b56142b0d8eb.png

2.method参数设置图形可视化的形状,method=c("circle","square","ellipse","number","shade","color","pie"),共有7种形状。

corrplot(cordata,type="full",method="ellipse")  #设置图形为椭圆

3068ec8faf1b43ae933dd10b5ed82cc7.png

corrplot(cordata,type="full",method="pie")  #设置图形为饼图

987ef9e10fc502a73a7862a68f40d0e4.png

3.通过函数corrplot.mixed绘制图形数值混合矩阵。

corrplot.mixed(cordata)  #绘制图形数字混合矩阵

8fcdecf052f07883d46b659692c3e087.png

corrplot.mixed(cordata,lower="ellipse",upper="circle",tl.col="black")  #下三角为圆形,上三角为椭圆

d5e093d6b605a38539b1c498c8c53436.png

4.order参数将结果按照不同的聚类方式排序,addrect参数添加分组,具体如下所示。

corrplot(cordata,order="hclust",addrect=2)  #以hclust聚类,分成2组

9e5bb357cd9638e51e07f1746d20272c.png

corrplot(cordata,order="hclust",addrect=2,col=heat.colors(100))  #修改颜色

03b957eddb964cf1d332fb501cecaf51.png

小锐课堂,收获颇丰

更多好货,敬请期待

我们下期再见!!!

下课啦

供稿:温平平

编辑:鲁淑妮

ae2c2719a3bcbc960f721cadb3734920.png
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值