1、安装,加载所用到到R包
用BiocManager安装,可同时加载依赖包
source("https://bioconductor.org/biocLite.R")
BiocManager::install("clusterProfiler")
library(clusterProfiler) ##富集分析
library(topGO) ###画GO图
library(AnnotationHub) ##获取数据库
library(BiocFileCache) ##依赖包
library(dbplyr) ##依赖包
library(pathview) ##看KEGG pathway
2、利用annotataionHub去抓取目标orgDb
ah <- AnnotationHub() ##收索所有orgdb,到ah
unique(ah$dataprovider) ##可查看数据注释来源
query(ah, "Apis cerana") ##查找目标物种
tar_org <- ah[["AH62635"]] ##下载目标物种到org数据
3、了解org数据库
主要有5个函数
columns(x): 显示当前对象有哪些数据
keytypes(x): 有哪些keytypes可以用作select或keys的keytypes参数 keys(x, keytype, ...):返回当前数据对象的keys select(x, keys, columns, keytype, ...):基于keys, columns和keytype以data.frame数据类型返回数据,可以是一对多的关系 mapIds(x, keys, column, keytype, ..., multiVals): 类似于select,只不过就返回一个列。
3.1 以symbol形式展示
head
(
keys
(tar_org,keytype =
"SYMBOL"
),30) ##默认为ENTREZID
3.2、可以查看gene类型
keytypes(tar_org)
[1] "ARACYC" "ARACYCENZYME" "ENTREZID" "ENZYME" "EVIDENCE" "EVIDENCEALL" "GENENAME" [8] "GO" "GOALL" "ONTOLOGY" "ONTOLOGYALL" "PATH" "PMID" "REFSEQ" [15] "SYMBOL" "TAIR"
3.3、select
则是根据你提供的key值去查找注释数据库,返回你需要的columns信息