R语言特征值相关性分析

转载:http://www.sohu.com/a/200219694_278730

也可以看一下这篇文章

接触这么多组学数据,大家肯定做过各种相关性分析。大到几个转录组样本的整体相关性分析,小到挑选了一些候选基因看它们在不同样本中的表达模式相关性。当我们做完了相关性分析的时候,常常会用下面这种图形来展示:

那么问题来了,有没有别的方法,可以让我的相关性分析展现方式更高大上呢?

请出今天的主角,corrplot程序包!

1

老规矩,第一步是安装并调用corrplot:

install.packages("corrplot")

library("corrplot")

2

第二步,整理数据。今天就拿一些女明星的身高、体重、年龄、微博粉丝与女神指数的数据来分析一下(纯属杜撰)。

3

第三步,我们读取数据,并做相关性分析。

a<-read.table(file=file.choose(),row.names=1,header=T,sep="t")

b<-cor(a)

4

第四步,非常简单,可以直接作图了。

corrplot(b) #这里默认是圆形显示

还可以用饼图(pie),颜色(color)等等来显示。

corrplot(b,method="pie")

corrplot(b,method="color",addCoef.col="grey") #用颜色显示,同时显示相关系数,是不是跟开头绿绿的图一样啦。

5

第五步,是时候展示高端操作了!我们把颜色对调一下,正相关为红色,负相关为海军蓝色,同时把右上角用圆形展示。

col=colorRampPalette(c("navy", "white", "firebrick3")) #设置颜色

corrplot(b,type="upper",col=col(10),tl.pos="d") #tl.pos="d"即不显示周边各列名字

6

第六步,填补下半部分图形,我们希望既可以图形化展示,也能显示数字,增强图形可读性。

corrplot(b,add=TRUE, type="lower", method="number",diag=FALSE,tl.pos="n", cl.pos="n",col=col(10))

相关性分析结论:

  1. 女神指数与身高成正相关,与体重呈负相关(嗯,符合大众审美);

  2. 女神指数与年龄相关性不明显(嗯,志玲姐姐立功了);

  3. 微博粉丝数与女神指数还是有一定正相关性;

  4. 大家也发现了,相关性其实都不是很显著,那是因为我们选的数据都是准女神以上级别的,她们之间的差距本来就很小,所以数据还是很反映规律的。

7

最后,我们添加一组贾玲和凤姐的数据,看看结果会不会有显著变化......

此图来源:https://blog.csdn.net/Blackrosetian/article/details/78426166

  • 1
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值