linux下载TCGA数据,好用的新版TCGA数据下载方法

1,摸索篇:

前几天开始了解TCGA数据库,想挖掘一下数据,先根据网上各种教程把你要下载的数据加入”购物车“,然后下载”manifest“,然后用官网推荐的GDC下载。于是我首先下载了linux版本的,结果需要linux库更新,结果我更新了半天,差点把系统搞崩溃。

2,下载篇:

于是放弃之,用windows版本,最后也一直没有成功,一直报错(报错了才知道是python报错,原来这个工具是用python写的?哇,python好强大,更要好好学习之)以为是系统不兼容,在群里问了才知道win10可以用,思来想去,可能是运行目录是中文目录,于是改之,可运行了。

3,升级篇:

现在可以下载了,可是问题是下载老是中断,无法忍受了(下载量小的windowns用户用此方法还是比较实用的)。这个时候看了一个帖子,就是我下载当天发的(太巧了!)于是我按图索骥,上面介绍用linux命令下载,但是那是个微信帖子(生信人转载的,感谢),上面的下载脚本点不开,于是我只好自己弄(后来工作人员给我原文了下载了脚本)。于是我就根据帖子描述的方法,用wget下载:wget:wget https://gdc-api.nci.nih.gov/data/UUID -O 文件名

UUID和文件名可以根据manifest文件获取,然后用awk批量生成下载命令,也可使用download.py脚本下载(链接:https://github.com/methylation/knowledge 这里的download.py脚本就是下载脚本,另外parse_json.pl 脚本可能有点问题,我试了一下,转化不了,后面再优化一下脚本看看)

4,鸣谢:

感谢@sisigreen 你的坚持让我有了发帖的动力,后面转化ID部分还请赐教!谢谢!

版主dachong99留言:

欢迎分享,加油~

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值