链客,专为开发者而生,有问必答!
此文章来自区块链技术社区,未经允许拒绝转载。
我们上一期介绍了如何实现GO分析的可视化,运行了GOplot包自带的数据并且很畅通。然而我们如何才能获取那些可以直接输入的数据表格或者说前期的工作是怎么实现的。今天就跟大家介绍下如何利用R语言实现GO的流程化分析。
我们需要以下三个包:GO.db是GO分析的数据基础它包含了GO的基本分层信息;topGO是基因的功能富集分析包;GOProfiles利用GO谱进行富集分析。接下来我们逐个介绍如何使用以上三个R包。所有包的安装我们就不赘述了,都是通过bioconductor进行安装的。
GO.db的使用:
首先,我们看下GO.db数据包的构成:
以上都是GO.db中的数据包,首先我们看下GO.db中包含的列
其他的数据是以工程文件的形式存在,在此需要进行转化转化函数as.list(GOTERM)可将其转化为list 的可检索文件。
接下来我们介绍下其主要的检索函数select(),首先看下它的函数构成:
Select(data,keys,columns,keytypes)
Keys检索的关键词,keytypes指的关键词的类型,columns指的那些列被列出来。
当然还有其他一些有用的函数:
Keys()列出数据的主键列,或者加keytypes参数获取对应的列
MapIds进行数据库的批量匹配。