TCGA|GEO可视化分析第1篇---相关性分析

TCGA|GEO可视化分析第1篇---相关性分析

导读

今天有小伙伴问我,筛选完差异基因后,想看自己关注的基因和其他基因的关系,应该怎么做?那当然要先做一下相关性分析了!好,下面让我给大家娓娓道来…

正文:

step1:我们先读取下所需要的数据

library(openxlsx)setwd("E:\\Bioinfo_analysis\\scripts\\corr\\corr_batch") #设置工作路径
fr<-read.xlsx('infile.xlsx',rowNames = T,colNames = T)
View(fr) #查看下数据类型,列名基因名,行名为样本名

在这里插入图片描述
Step2:下载安装包

library("ggstatsplot") #加载包的时候失败了,因为之前没有安装这个包
library("BiocManager")
BiocManager::install("ggstatsplot") #安装ggstatsplot

要安装很多依赖包,泡杯咖啡,静静的等着它,差不多花了30分钟才把所有的包安装完,下面开始进行相关性分析,假如我们关注的基因是COX1和ATP6。
Step3:绘图

ggscatterstats(data = fr, 
y = COX1, 
x = ATP6,
centrality.para = "mean", 
margins = "both",
xfill = "red", 
yfill = "blue", 
marginal.type = "histogram",
title = "Relationship")

在这里插入图片描述
图出来的还是很快的,大概5秒钟。图中每个点代表一个样本,两条虚线分别代表两个基因在样本中的平均表达量。看一下结果,P<0.001,r=0.46,说明COX1, ATP6存在正相关关系,P值过关了,不过相关系数r有点低,还没有超过0.5。
到这里结束了么,不。我的小伙伴又问了,我想看一下COX1和其他所有基因的相关性怎么办?你手动一个个画呗。。。。哈哈哈,开个玩笑,这里我们可以用ggcorrplot绘图!

corr.result<-cor(fr,method = 'pearson') #先计算相关性系数
	corr.p<-ggcorrplot::cor_pmat(fr) #再计算P值
	#开始绘图
	ggcorrplot(  corr = corr.result,  type = 'full')

在这里插入图片描述
如果你想看哪些基因间是显著性相关,怎么办,往下看

ggcorrplot( 
corr = corr.result,  
type = 'full',  
p.mat = corr.p,#P-Value  
sig.level = 0.05 #P-Value大于0.05的在图中标记出来)

在这里插入图片描述
图中标记❌号的即为P值大于0.05的,反之为P值小于0.05。今天就给大家介绍到这里,有什么疑问或者建议,可以下方留言探讨哦!

  • 11
    点赞
  • 75
    收藏
    觉得还不错? 一键收藏
  • 12
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 12
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值