欢迎关注”生信修炼手册”!
TCGAbiolinks是一个分析处理TCGA数据的R包,通过GDC API来查询和下载TCGA的数据,同时提供了差异分析,生存分析,富集分析等常见的分析功能,网址如下
http://bioconductor.org/packages/release/bioc/html/TCGAbiolinks.html
这个R包的基本用法如下
1. Query
和在线查询类似,只不过是将网页上的各种可选的属性变成了对应的参数,基本用法如下所示
以project
为核心进行查询, 其他参数用来对数据进行过滤,常用的有以下几个参数
datga.category
data.type
workflow.type
experimental.strategy
platform
access
以上参数和和网页上的的各项选择菜单相对应,示意如下
除此之外,还有几个重要参数,legacy
参数的默认值为FALSE
,表示从harmonized database进行查