通过RNA_seq差异表达分析等获得一组基因,想要进一步了解这些基因可能参与哪些生物学过程,具有哪些功能,一般就会用到基因的富集分析了。现在小麦基因注释信息已经可以获得,目前来看包括两套。一个是TGACv1,另一个就是IWGSC1.0。需要用到一个叫“clusterProfiler”的R包。下面用到的数据集来自TGACv1。
1、安装
source("https://bioconductor.org/biocLite.R")
biocLite("clusterProfiler")
biocLite("topGO")
install.packages("DOSE")
需要的文件有3个,格式见下图。