使用GDC在线查看TCGA数据

本文介绍了GDC(Genomic Data Commons)——一个由NCI建立的癌症数据共享系统,用于整合和提供癌症研究数据。文章详细阐述了GDC的数据来源、数据模型,以及如何通过GDC门户进行项目浏览、探索、分析和数据获取。读者将了解到如何筛选和分析TCGA项目中的病例、基因、突变,并进行生存分析和数据下载。
摘要由CSDN通过智能技术生成

欢迎关注”生信修炼手册”!

GDC是Genomic Data Commons的缩写,是由美国国家癌症研究所NCI建立的一套癌症数据共享系统,整合包括TCGA在内的多个癌症数据库中的信息,提供了癌症数据的统一存储,管理,展示,将数据与世界范围内的癌症基因组学研究者共享,网址如下

https://portal.gdc.cancer.gov/

数据来源于以下多个大型癌症研究组织和项目

  1. Foundation Medicine(FM)

  2. Clinical Proteomic Tumor Analysis Consortium(CPTAC)

  3. THe Cancer Genome Atlas(TCGA)

  4. Therapeutically Applicable Research to Generate Effective Treatments (TARGET)

  5. Human Cancer Model Initiative (HCMI)

以上只是部分来源信息,而且还在陆续更新,以后也会有新的来源数据整合到GDC中。当然,到目前为止,该数据库中最大的数据依然是来自TCGA的数据。

为了方便管理如果大量的数据,建立了一个统一的数据模型,如下所示

最高层级为program

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值