欢迎关注微信公众号《生信修炼手册》!
在生信分析领域,R语言由于其简单易用的特点和良好的生态环境,占用重要的一席之地。其中,Bioconductor作为生信分析专用的R语言社区,提供了许多的R包。
software
类型的R包用于执行某项具体的分析内容,比如edgeR
, DESeq2
等,AnnotationData
类型的包在R中存储了对应的数据库,比如GO.db
等,ExperimentData
类型的包存储了实验数据,Workflow
类型的包提供了完整分析的pipeline。本文主要介绍AnnotationData
类型的包。
为了规范化开发,方便R包的使用,Bioconductor的开发者提供了几种基础的R包,用于定义几种基础信息的存储方式。
对于数据库内容的存储和使用,在AnnotationDbi
这个包中统一进行了定义。由于采用了面向对象的编程方式,所有继承了这种对象的R包其使用方式是一样的。
在Bioconductor中,有以下4种类别的注释信息包,都继承了AnnotationDbi
-
Organism level
比如human对应的Org.Hs.eg.db
, 存储了人类的基因信息 -
Platform level
比如