首先TCGA数据集我是跟着这位博主的教程下载的,附链接最新TCGA数据库下载教程 - 知乎,筛选到所需数据后,因直接下载数据量太大,所以需要在下载完Manifest文件之后下载GDC Data Transfer Tool工具来下载数据,这时候只需要这个工具软件和Manifest文件即可。
我遇到的第一个问题:出现Error:Invalid or unsupported zip format.No END header found Close all instances and restart please.
显示压缩文件有问题,但我是从官网下载的,并且重启后这个Error还是会出现,但其实并不影响下载。
第二个问题就是出现下载失败的情况,Log日志文件(怎么看日志文件在下文)显示一堆乱码还有一部分是一串文件路径和gdc-client.exe download......类似下边这句,其实这是GDC Data Transfer Tool_UI版本的自动命令执行,查看发现该文件路径下没有gdc-client.exe这个执行程序,这时候就需要去官网下载GDC Data Transfer Tool_Client版本(GDC Data Transfer Tool不同版本看下文),我下载的是gdc-client_2.3_Windows_x64
解压之后将gdc-client.exe这个执行程序拷贝到报错路径里,同时将gdc-client.exe这个执行程序所在的路径添加到环境变量里,就可以成功下载了
查看Failed日志文件
GDC Data Transfer Tool不同版本:建议下载UI版本,操作简单
第三个问题是有几个文件反复尝试下载还是失败,如果文件个数较少的话可以去官网手动下载,只需要复制UUID号,在官网搜索栏搜索并下载即可,这个UUID显示不完整的话就打开日志文件找到UUID并复制