原标题:开启数据挖掘之门:TCGA数据库入门必看!
喜欢我的都关注我了~
在肿瘤研究领域,相信没有人不知道The Cancer Genome Atlas (TCGA)。
TCGA是美国国家癌症研究所(National Cancer Institute)和美国人类基因组研究所(National Human Genome Research Institute)共同监督的一个项目,旨在应用高通量的基因组分析技术,以帮助人们对癌症有个更好的认知,从而提高对于癌症的预防、诊断和治疗能力。
作为目前最大的癌症基因信息数据库,TCGA的全面不仅仅体现在众多癌型上(覆盖33种癌症类型,超过30000例肿瘤样本,超过20000个基因的表达信息),还体现在多组学数据(包括基因表达数据、miRNA表达数据、拷贝数变异、DNA甲基化、SNP等)。
TCGA作为肿瘤研究中资源最丰富,数据最权威的数据库,自然受到广大科研工作者的深入挖掘。无数的文章脱胎于通过挖掘TCGA数据,同时也促使了不计其数的衍生的数据库用于挖掘可视化TCGA这个巨大的资源。
壹
TCGA相关数据库
1
综合型数据库
在这些不计其数的数据库中,有那么几个数据库由于其超强实用的功能,为肿瘤研究者青睐,受到普遍关注。
➱TCGA官方网站
官网https://portal.gdc.cancer.gov/
最权威的网站资源(数据可以无代码下载,当数据较大时也可以通过GDCRNAtools工具包下载)
➱cBioPortal
官网http://www.cbioportal.org/
一个基于TCGA数据库,进行可视化分析的网页,不需要代码,里面内容十分丰富,提供了最详细的TCGA在线分析展示。业界人称“TCGA数据挖掘终结者”。(数据可以无代码下载,也可以通过CGDSR工具包下载)
➱Oncomine
官网
https://www.oncomine.org/resource/login.html
目前最大的癌症基因芯片数据库ÿ