gdc-client.exe使用教程
(前排推荐一下自己写的gdc-client窗体辅助运行程序,可以在窗口中更直观地使用gdc-client的下载功能,省去不停敲命令行的麻烦(′▽`〃)
自制gdc-client.exe窗体辅助运行程序
https://blog.csdn.net/Re_98560286270/article/details/137300389
0.简介
需要的文件:
0.1 exe本体
这个没啥好说,可执行文件,看图标是python写的
0.2 txt文件
在download命令里反复看到txt,看了一圈博客,txt应该是一个“购物车”,你去TCGA官网选好你要下载的数据库,然后按一下官网的一个按钮,官网会返回给你一个数据库名单,然后你拿着这个txt名单去gdc client.exe,软件会帮你一个个下载
0.3 dtt文件
(没弄到默认设置,用自己的dll顶替一下)(该文件不是必须的)
配置文件,看到不少博客说这个软件下载速度很难受,改dll可能会有用…
看别人说这条命令能看setting…不过我这里好像不行,而且这条命令直接把我的exe给清了…总之谨慎设置吧…
【拓展】dtt文件详细内容【该步骤专门用于解决网络问题,可以先跳过】(该部分内容来自网络,楼主还没实机操作过,仅供mark)
默认setting内容:
[download]
no_auto_retry = False
no_file_md5sum = False
save_interval = 1073741824
retry_amount = 1
n_processes = 4
no_annotations = False
no_related_files = False
http_chunk_size = 1048576
no_segment_md5sum = False
server = https://api.gdc.cancer.gov
wait_time = 5.0
no_verify = False
dir = .
机翻一下:
无自动重试=错误
无文件md5sum=False
保存间隔=1073741824
重试次数=1
n_processes=4
无注释=错误
无相关文件=错误
http区块大小=1048576 ——>每一次http请求的数据块大小,怕断线可以调小
无分段md5sum=False
服务器=https://api.gdc.cancer.gov
等待时间=5.0 ——>http请求的等待时间,可以调大些
no verify=False ——>校验
dir=。
修改后的dll:来自https://www.jianshu.com/p/bea374ce82b3
[download]
no_auto_retry = False
no_file_md5sum = False
save_interval = 1073741824
retry_amount = 6
n_processes = 4
no_annotations = False
no_related_files = False
http_chunk_size = 4096
no_segment_md5sum = False
server = https://api.gdc.cancer.gov
wait_time = 25.0
no_verify = True
dir = .
然后把后缀改个dtt,保存
1. 配置全局变量
(本步实机操作未成功…先跳过这一步吧,仅供参考,mark)
右键此电脑 --> 属性,打开高级系统设置
打开环境变量
双击系统变量中的Path
新建或者浏览,把你的gdc client目录添加上
ps:经测试,还是要控制台切到对应文件路径才能用,鬼知道哪里出了问题…汗
如果你需要手动移动控制台位置,在控制台使用下面的指令
cd [路径]
2. TCGA官网获取数据
官网:https://www.cancer.gov/ccg/research/genome-sequencing/tcga
点击Access TCGA Data
然后是这个界面:
选择Repository界面(
这里把前两页的txt文件全选上,用于测试
购物车页面:
下载Manifest
现在就拿到正经的下载目录了
内容:
3. download命令下载
3.1 首先演示没有mainfest文件时download会怎么报错:
gdc-client error: argument -m/–manifest: can’t open ‘gdc_manifest.txt’: [Errno 2] No such file or directory: ‘gdc_manifest.txt’
gdc客户端错误:参数-m/–manifest:无法打开“gdc_manifest.txt”:[Erno 2]没有这样的文件或目录:“gdc_manifest.txt”
再演示一下空的manifest下载:
3.2 正经的manifest下载
1.先进入路径:
2.下载命令格式:
gdc-client.exe download [--config] [dtt文件名] -m gdc_manifest.txt文件名
正式下载:
gdc-client download -m D:\gdc-client_[MEDICINE]\gdc_manifest_20231025_031114.txt
成功下载