引言
老板对某些基因感兴趣,但是针对这批基因的后续研究不知道从哪个方向入手,组会上就会让你做个gesa。
要求是:根据某个基因的表达量高低分组,在两个组件有哪些通路有差异?
这时候一个两个基因尚可以方便地使用web工具java工具进行。但是这样做缺点很大,比如java软件做gsea:缺点有:
第一、工作量大。
第二、设置表单很容易出错。
第三、速度也不快。
使用R语言自己变成作分析优势有:
1、无论来多少基因都可以一起做分析
2、批量出图方便快捷
3、鼠标不用点点点,还设置错。
R语言实现
加载包
BiocManager::install("ReactomePA")
library(ReactomePA)
library(clusterProfiler)
library(GSEABase)
library(enrichplot)
library(statmod)
library(limma)
library(edgeR)
library(tidyverse)
library(data.table)
library(org.Hs.eg.db)
library(biomaRt)
载入数据
expr <- read_csv("~/Rcode/gsea/TCGA-KIRC.csv") #用tcga的透明细胞癌数据集做demo
数据预览: