TCGA数据,指癌症测序数据,TCGA的全称为The Cancer Genome Atlas,癌症基因组图谱(TCGA)是美国国家癌症研究所(NCI)和国家人类基因组研究所(NHGRI)已生成的33种癌症的基因组的关键变化全方位,多三维地图之间的合作的TCGA数据集,其包含基因组数据的两个以上的PB的,已取得公开可用,以及该基因组信息有助于癌症研究界,提高预防,诊断,和治疗癌症。
自从2016年6月份去西安第四军医大学上了肿瘤培训的暑期学校,对TCGA数据的研究变开始了。莫名的觉得在这个领域可以做很多工作,贡献很多的力量。哈哈,TCGA数据蕴藏很多宝。
下面开始对TCGA数据的下载做介绍。对基因表达数据,可用于下载的是level 3 的,在官网http://cancergenome.nih.gov/ 已经不提供直接下载方式,目前见的多的是用API或data-transfer-tool,可惜两个我都不会。我想我只会R语言,应该高手开发出了类似的包来供科研者使用吧,果不其然,发现了好几个可以下载TCG的A数据的包。这些包我都做过实验,有些下载效果很好,有些下载不稳定,其中缘故不清,也许我的网络环境不好也是有可能的,现把我了解的都分享出来,其中好坏效果,当由你来实验判断。
TCGA2STAT
官网:
https:/