go kegg_clusterProfiler 的 GO/KEGG 富集分析用法小结

本文详细介绍了如何使用go kegg_clusterProfiler进行GO和KEGG富集分析,包括ORA和GSEA两种方法,并提供了可视化结果的展示。文章讨论了物种信息的重要性,以及在缺乏物种信息时如何进行基因注释。还给出了具体的GO富集和KEGG Pathway富集的参考代码。
摘要由CSDN通过智能技术生成

以下文章来源于简书,作者 biobin,文章已获原作者授权。

前言


关于 clusterProfiler这个 R 包就不介绍了,网红教授宣传得很成功,功能也比较强大,主要是做 GO 和 KEGG 的功能富集及其可视化。简单总结下用法,以后用时可直接找来用。
首先考虑一个问题: clusterProfiler做 GO 和 KEGG 富集分析的注释信息来自哪里?
GO 的注释信息来自 Bioconductor,提供了19个物种的 org 类型的 GO 注释信息,如下表所示。Bioconductor 中更多的注释包可参考下面这个链接,很乱,大多数我都不知道干啥用的。
  • http://www.bioconductor.org/packages/release/data/annotation/
e4ebe48f6440ccffa87bae2698561cc5.png
KEGG 的注释信息 clusterProfiler通过 KEGG 数据库的 API 来获取, https://www.kegg.jp/kegg/rest/keggapi.html。

首先是一个物种所有基因对应的 pathway 注释文件,比如人的:http://rest.kegg.jp/link/hsa/pathway。

其次还需要 pathway 的描述信息,比如人的:http://rest.kegg.jp/list/pathway/hsa。

关于 KEGG 数据库全部的物种及其简写(三个字母)如下列表(部分截图):

d1d791f510bc831ad4f9c9b4042e5a35.png
https://www.genome.jp/kegg/catalog/org_list.html

因此对于以上已有 pathway 注释的物种,只需要将物种简写输入给clusterProfiler, 它会通过联网自动获取该物种的 pathway 注释信息。

以上都是有物种信息的情况,那么对于无物种信息的项目怎么办?

GO 可以通过读取外部的 GO 注释文件进行分析。关于基因的 GO 注释,interproscaneggnog-mapperblas2go等软件都可以做,不过输出格式有些不同。clus

  • 2
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值