TCGA(The Cancer Genome Atlas, 癌症基因组图谱
)是美国国家癌症研究所(National Cancer Institute)和美国人类基因组研究所(National Human Genome Research Institute)共同监督的一个项目,旨在应用高通量的基因组分析技术,以帮助人们对癌症有个更好的认知,从而提高对于癌症的预防、诊断和治疗能力。
TCGA官方的网站链接是:https://portal.gdc.cancer.gov/https://portal.gdc.cancer.gov/
下面介绍一个各个方便快捷的数据库,即是UCSC xena,链接是 UCSC Xenahttp://xena.ucsc.edu/
这是数据库的主界面,现在已经改版:
下面直接说数据库怎么下载。
滑动滚轮至页面下方:
点击learn more。
点击launch Xena。
点击data hubs。
红框即是整理好的TCGA数据库。
我们点击TCGA hub:
可以看到这里包含了33种癌症组织的数据。
但是TCGA hub不及GDC好用,因为没有对应的癌旁组织。因此,下载TCGA hub里面的测序数据库时,没办法进行差异表达分析。所有推荐选择GDC hub:
GDC hub种除了TCGA数据库以外,还有别的平台数据,例如Target。
下面我们点击一个癌症进去看一看:
这是食管癌的数据,可以看到里面的数据时非常丰富的,包含mRNA测序数据,拷贝数变异数据,突变数据,miRNA数据,临床数据等。
要研究哪个癌症就下载哪个数据吧。