欢迎关注”生信修炼手册”!
GDC是Genomic Data Commons
的缩写,是由美国国家癌症研究所NCI建立的一套癌症数据共享系统,整合包括TCGA
在内的多个癌症数据库中的信息,提供了癌症数据的统一存储,管理,展示,将数据与世界范围内的癌症基因组学研究者共享,网址如下
https://portal.gdc.cancer.gov/
数据来源于以下多个大型癌症研究组织和项目
Foundation Medicine(FM)
Clinical Proteomic Tumor Analysis Consortium(CPTAC)
THe Cancer Genome Atlas(TCGA)
Therapeutically Applicable Research to Generate Effective Treatments (TARGET)
Human Cancer Model Initiative (HCMI)
以上只是部分来源信息,而且还在陆续更新,以后也会有新的来源数据整合到GDC
中。当然,到目前为止,该数据库中最大的数据依然是来自TCGA
的数据。
为了方便管理如果大量的数据,建立了一个统一的数据模型,如下所示
最高层级为program