R包对植物进行GO，KEGG注释

最新推荐文章于 2023-01-09 16:08:35 发布

weixin_30300225

最新推荐文章于 2023-01-09 16:08:35 发布

阅读量921

点赞数 1

原文链接：http://www.cnblogs.com/zhanmaomao/p/11529589.html

版权

本文介绍了如何使用R包clusterProfiler、topGO、AnnotationHub等进行植物基因的GO和KEGG注释及富集分析。通过AnnotationHub获取目标物种的orgDb，然后利用相关函数进行基因ID转换、GO和KEGG富集分析，并展示了包括柱状图、点图、Gene-Concept Network和Enrichment Map在内的多种可视化方法。

摘要由CSDN通过智能技术生成

1、安装，加载所用到到R包

用BiocManager安装，可同时加载依赖包

source("https://bioconductor.org/biocLite.R")

BiocManager::install("clusterProfiler")

library(clusterProfiler) ##富集分析
library(topGO) ###画GO图
library(AnnotationHub) ##获取数据库
library(BiocFileCache) ##依赖包
library(dbplyr) ##依赖包
library(pathview) ##看KEGG pathway

2、利用annotataionHub去抓取目标orgDb

ah <- AnnotationHub() ##收索所有orgdb，到ah

unique(ah$dataprovider) ##可查看数据注释来源

query(ah, "Apis cerana") ##查找目标物种

tar_org <- ah[["AH62635"]] ##下载目标物种到org数据

3、了解org数据库

主要有5个函数

columns(x)： 显示当前对象有哪些数据
keytypes(x)： 有哪些keytypes可以用作select或keys的keytypes参数 keys(x, keytype, ...)：返回当前数据对象的keys select(x, keys, columns, keytype, ...)：基于keys, columns和keytype以data.frame数据类型返回数据，可以是一对多的关系 mapIds(x, keys, column, keytype, ..., multiVals)： 类似于select，只不过就返回一个列。

3.1 以symbol形式展示

head(keys(tar_org,keytype = "SYMBOL"),30) ##默认为ENTREZID

3.2、可以查看gene类型

keytypes(tar_org)
 [1] "ARACYC" "ARACYCENZYME" "ENTREZID" "ENZYME" "EVIDENCE" "EVIDENCEALL" "GENENAME" [8] "GO" "GOALL" "ONTOLOGY" "ONTOLOGYALL" "PATH" "PMID" "REFSEQ" [15] "SYMBOL" "TAIR"