写在前面
今天课题组师妹与我提到,其要下载Phytozome上的所有数据。这个事情,我在早在几年前干过。不过前年有整了一次。整体简单,以下附上之前的记录。
2017年的记录
稍微整理了流程,方便批量下载JGI基因组数据。因为一个一个点,一个一个下载,太浪费时间且不稳定。调试了下,直接开80个下载任务,批量下载JGI目前已有的所有植物基因组序列(20170405),共72个。
首先,在JGI上注册一个账号,
http://genome.jgi.doe.gov/
得到账号密码,如
账号:yourAccount
密码:youPassword
在linux上,使用curl登录并保存cookies(不知道cookies的,可以理解为登陆信息)
# 2017年的链接方式已经失效
# curl https://signon.jgi.doe.gov/signon/create --data-ascii login=yourAccount\&password=youPassword -b cookies -c cookies > /dev/null
# 目前有效的链接方式是
curl 'https://signon-old.jgi.doe.gov/signon/create' --data-urlencode 'login=yourAccount' --data-urlencode 'password