R包对植物进行GO,KEGG注释

本文介绍了如何使用R包clusterProfiler、topGO、AnnotationHub等进行植物基因的GO和KEGG注释及富集分析。通过AnnotationHub获取目标物种的orgDb,然后利用相关函数进行基因ID转换、GO和KEGG富集分析,并展示了包括柱状图、点图、Gene-Concept Network和Enrichment Map在内的多种可视化方法。
摘要由CSDN通过智能技术生成

1、安装,加载所用到到R包

用BiocManager安装,可同时加载依赖包

source("https://bioconductor.org/biocLite.R")

BiocManager::install("clusterProfiler")

 

library(clusterProfiler) ##富集分析
library(topGO) ###画GO图
library(AnnotationHub) ##获取数据库
library(BiocFileCache) ##依赖包
library(dbplyr) ##依赖包
library(pathview) ##看KEGG pathway

2、利用annotataionHub去抓取目标orgDb

ah <- AnnotationHub()  ##收索所有orgdb,到ah

unique(ah$dataprovider) ##可查看数据注释来源

query(ah, "Apis cerana")  ##查找目标物种

tar_org <- ah[["AH62635"]] ##下载目标物种到org数据

3、了解org数据库

主要有5个函数

columns(x): 显示当前对象有哪些数据
keytypes(x): 有哪些keytypes可以用作select或keys的keytypes参数 keys(x, keytype, ...):返回当前数据对象的keys select(x, keys, columns, keytype, ...):基于keys, columns和keytype以data.frame数据类型返回数据,可以是一对多的关系 mapIds(x, keys, column, keytype, ..., multiVals): 类似于select,只不过就返回一个列。

3.1 以symbol形式展示

head(keys(tar_org,keytype = "SYMBOL"),30)  ##默认为ENTREZID

 

 

3.2、可以查看gene类型

keytypes(tar_org)
 [1] "ARACYC" "ARACYCENZYME" "ENTREZID" "ENZYME" "EVIDENCE" "EVIDENCEALL" "GENENAME" [8] "GO" "GOALL" "ONTOLOGY" "ONTOLOGYALL" "PATH" "PMID" "REFSEQ" [15] "SYMBOL" "TAIR" 

3.3、select则是根据你提供的key值去查找注释数据库,返回你需要的columns信息

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值