写在前面
这个其实很简单啦!三个R包可以搞定的事情。
三个包分是:clusterProfiler,pathview,org.Hs.eg.db。
clusterProfiler,pathview两个包用于绘图,org.Hs.eg.db是用于clusterProfiler注释的人类的数据库。
先说安装,我这里是R-3.4.4的版本,用如下的安装方式,3.5+版本的请见官网哦:
source("https://bioconductor.org/biocLite.R")
biocLite("pathview")
library(pathview)
这里拿一个包举例子,其它请大家自己举一反三。要碎碎念一句,biocLite安装的时候包名是必须要有双引号的哦,执行library的时候就很随意啦,单引号,双引号,不加都OK。
开始分析
做差异基因的注释,只需要差异基因的entrez_ID。这一步用到的包是clusterProfiler和org.Hs.eg.db。
我的输入表格格式如图所示(数据都是随便编的,毕竟不能泄露真实数据):
>head(data)
Gene ABCDEF
ENSG00000067082.14100115108300303290
ENSG00000134852.1499101100700710690
ENSG00000125538.11300032003100100012001100
ENSG00000006831.920151510010595
ENSG00000