单个基因水平上能反映的生物学信息有限,很多时候要进行通路富集分析,来从系统水平上反映出一组基因与哪些生物学通路相关。
假如你有一组感兴趣的基因,如何进行通路富集?
假如你感兴趣的这组基因是来源于特定芯片panel(而非全基因组),如何设置合适的背景基因集合进行通路富集分析?
假如你想比较两组感兴趣基因集合的通路异同又应如何操作呢?
......
今天我们就来谈谈Y叔开发的ClusterProfiler包做通路富集时的应用场景和详细步骤(以Homo sapiens为例)。
Step1.文件准备(如图1)。
1. 将所有文件存放于本地路径中(如D:/Bioming)。
2. 感兴趣的基因集合文件,每个基因为一行。(感兴趣的基因集合可以是差异表达基因、差异甲基化基因、突变基因集合等)。文件格式如图2。
3. 若感兴趣的基因集合是基于特定的panel芯片得到的,而并非全基因组数据,则需要准备背景基因集合文件,文件中包含了panel中所覆盖的所有基因,格式同图2。
4. 若需要将两组感兴趣的基因集合进行通路比较(如原发灶突变基因与转移灶突变基因所富集通路比较等),需要准备另一组文件感兴趣的基因集合2。
图1
图2
Step2.R语言执行通路富集分析。
进入到R界面,若未安装过ClusterProfiler包,用如下命令安装:
if (!requireNamespace("BiocManager", quietly = TRUE))
install.packages("BiocManager")</