半年前我就系统性的介绍过:TCGA的pan-caner资料大全(以后挖掘TCGA数据库就用它) 还专门指出了癌症的somatic突变的maf文件问题:TCGA数据库maf突变资料官方大全
但是最近收到学员的反应,TCGA的maf文件开始控制下载了,下面是提问详情:
非常久之前,整个TCGA数据库的全部数据都是提供下载的,包括fastq,bam,vcf, 但是呢,后来因为保护病人隐私,就只开放maf格式的somatic突变数据下载。学员在下载全部TCGA数据库的maf的时候,突然间发现,受限制了:
我仔细查看了其更新说明:https://docs.gdc.cancer.gov/Data/Release_Notes/Data_Release_Notes/
MAFs are not yet available for query or search in the GDC Data Portal or API.
You may download these files using the following manifests, which can be passed directly to the Data Transfer Tool. Links for the open-access TCGA MAFs are provided below for downloading individual files.
- Open-access MAFs manifest
- Controlled-access MAFs manifest
虽然官网装模作样的提供了一个公开版的maf下载,事实上我并没有下载成功,不知道为什么。
癌症的somatic突变概念需要自行搜索学习,如果你还不了解maf格式,请看