2 theme y轴_单基因生信分析2下游分析

前期小王子已经更过单基因生信分析--差异分析&生存分析,今天,小王子跟大家一起学习如何进行下游挖掘,也就是本期主打的单基因下游富集通路,以下以TCGA数据库中的LIHC数据为例,跳跃的部分大家可以结合着前期推送一起看。一、整理基因表达数据:将TCGA中的LIHC基因表达数据整理成如下形式的数据:######整理基因表达数据######rm(list = ls())library(...
摘要由CSDN通过智能技术生成
前期小王子已经更过单基因生信分析--差异分析&生存分析,今天,小王子跟大家一起学习如何进行下游挖掘,也就是本期主打的单基因下游富集通路,以下以TCGA数据库中的LIHC数据为例,跳跃的部分大家可以结合着前期推送一起看。 一、整理基因表达数据:将TCGA中的LIHC基因表达数据整理成如下形式的数据:

eb4bd17c4a271669de8d4a344498565d.png

######整理基因表达数据######rm(list = ls())library(data.table)library(magrittr)expr 'TCGA-LIHC.htseq_fpkm.tsv.gz',h=T,check.names = F)ann 'gencode.v22.annotation.gene.probeMap',h=T)expr2 1:library(limma)expr2 -1],ID=expr2$gene) %>% expr3 as.data.frame(t(expr2))expr4 ###将基因按照首字母排列
二、进行相关性分析:

相关性分析常用的有pearson相关系数和spearman相关系数,其中pearson相关系数适用于连续性变量,且变量服从正态分布的情况,为参数性的相关系数;而spearman相关系数适用于连续性及分类型变量,为非参数性的相关系数。以下采用spearman相关。

######进行相关性分析######gene "A1BG"]) col data for (i in 1:length(col)){
      test type=  data[i,2] test  data[i,3] test  }
三、设置筛选条件,获得最终的显著相关基因:

这里的p值<0.05会有很多基因满足,我们需要进一步根据筛选出来的基因个数来设置相关系数cor的阈值,这里小王子设置成0.6,

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值