GO、KEGG分类富集图绘制工具对给定的基因集结合注释信息绘制GO分类富集图、KEGG分类富集及通路富集图。GO分类富集图是通过对基因进行GO terms 富集度统计学的分析,计算出基因的P_value和Corrected_P-value,定位基因最可能相关的GO term。KEGG分类富集图是可以把显著的pathway进行富集,有助于找到实验条件下显著性变化的生物学调控通路。
适用数据类型:转录组研究数据和基因组研究数据
软件:R包(ggplot2)
操作步骤
登录百迈客云首页(www.biocloud.net)——分析——工具——绘制GO和KEGG富集图。
操作方法
1.输入文件
Anno: 是所有基因功能注释的结果总表,一般百迈客的有参、无参项目中会有这个数据,通常的命名为All_Database_annotation.xls。
Genes_id: 指需要进行分析的基因集文件,txt文本格式,每一行是一个基因的名字。
GO_top_lines:指定前多少行用于GO富集绘图,在进行GO富集分析的时候,会将结果按P值进行排序,然后挑选前n行进行绘图,默认为20。
2.注意事项
(1)注释总表(All_Database_annotation.xls),该文件包含Integrated_Function.anno、Function_anno.stat、GO.list、GO_tree.stat、Kegg.pathway、Kegg.ko等6个工作表,其中GO.list、GO_tree.stat、Kegg.pathway、Kegg.ko这四个必须包含,且命名完全一致。
(2)Genes_id和注释总表的基因ID相对应;
(3)文件名称:包含字母数字以及下划线,不能以数字开头,不能有空格,不能有特殊字符等。
(4)如果是在百迈客云上分析的结果,只需要在项目结果中找到All_Database_annotation.xls文件输入即可。如果不是在百迈客做的项目,没有这个文件,您需要先将FASTA格式的文件在云平台的“基因功能注释”小工具中得到All_Database_annotation.xls,如下示意图。
3.结果说明
该结果包含两个文件GO和KEGG
GO包含以下文件:
其中go_enrichment.png是GO富集结果图,选择置信度Pvalue最高的20个绘制通路富集图;GO.Classification.png是GO分类图。
KEGG包含以下文件:
KEGG.Classification.png是KEGG分类图
案例展示
百迈客云平台的GO、KEGG分类富集图绘制小工具得到了许多老师的认可,目前已经有一些老师运用这款小工具发表了文章,比如郑州大学安秀丽老师课题组对四倍体与二倍体芜菁转录组比较分析的研究中运用了GO、KEGG分类富集图绘制工具,文章发表在《Frontiers in Plant Science》杂志上。
此外,中国农业科学院油料作物研究所的胡琼老师课题组对参与油菜分蘖调控相关信号通路的研究中也运用了GO、KEGG分类富集图绘制工具,文章发表在《Int J Mol Sci》杂志上。
1. Zhao R, Feng J, Yin X, et al. Antibiotic resistome in landfill leachate from different cities of China deciphered by metagenomic analysis.[J]. Water Research, 2018, 134:126–139.
2. Cheng H, Hao M, Wang W, et al. Integrative RNA- and miRNA-Profile Analysis Reveals a Likely Role of BR and Auxin Signaling in Branch Angle Regulation ofB. napus:[J]. International Journal of Molecular Sciences, 2017, 18(5):887.