Aspera从NCBI下载基因组数据

1.下载/安装Aspera
下载地址:http://downloads.asperasoft.com/en/downloads/8?list
选择对应的版本,我用的是centos7_x64服务器,安装文件aspera-connect-3.7.2.141527-linux-64.sh
使用普通用户进行安装

sh aspera-connect-3.7.2.141527-linux-64.sh

把aspera-license复制到系统目录

sudo cp ~/.aspera/connect/etc/aspera-license /usr/local/bin/

2.下载sra数据

~/.aspera/connect/bin/ascp -k 1 -QT -l 100M -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -T anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByExp/sra/ERX/ERX069/ERX069505/ERR091571 .

-i后面是秘钥文件,如果是直接操作服务器终端秘钥文件为:asperaweb_id_dsa.putty,若是ssh登陆则是上面的秘钥。把对应的ftp地址换成上面的格式即可,后面的.表示下载保存路径,这里为当前目录
(ps:ncbi更新了ftp目录,可以根据后缀ID查找ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/ERR/ERR091/ERR091571/

注意事项
Q1: Q 1 :

若使用ssh登录服务器,运行命令后提示你要输入密码,把秘钥文件改成asperaweb_id_dsa.openssh

Q2: Q 2 :

Session Stop  (Error: Server aborted session: Client requests stronger encryption than server allows)

添加 参数-T可以解决该问题

ascp -T file transfer_user@host:/

Q3: Q 3 :
aspera默认不支持断点续传,要支持这个功能添加参数

ascp -k 1 

参考:
https://www.plob.org/article/3013.html
https://support.asperasoft.com/hc/en-us/articles/216126788-Error-Client-requests-stronger-encryption-than-server-allows
https://support.asperasoft.com/hc/en-us/articles/216125578-Resuming-file-transfers-with-ascp
https://www.plob.org/article/7338.html 获取ftp下载地址

好的,下面是三种下载NCBI GEO数据的方法: 方法一:使用wget命令下载GEO数据 1. 打开NCBI GEO网站(https://www.ncbi.nlm.nih.gov/geo/); 2. 在搜索框中输入GEO数据的ID,如GSE12345; 3. 在搜索结果页面中点击“FTP”按钮,进入FTP页面; 4. 复制FTP链接,如ftp://ftp.ncbi.nlm.nih.gov/geo/series/GSE12nnn/GSE12345/suppl/GSE12345_RAW.tar; 5. 在Linux终端中输入wget命令下载数据,如:wget ftp://ftp.ncbi.nlm.nih.gov/geo/series/GSE12nnn/GSE12345/suppl/GSE12345_RAW.tar。 方法二:使用rsync命令下载GEO数据 1. 打开NCBI GEO网站(https://www.ncbi.nlm.nih.gov/geo/); 2. 在搜索框中输入GEO数据的ID,如GSE12345; 3. 在搜索结果页面中点击“FTP”按钮,进入FTP页面; 4. 复制FTP链接,如ftp://ftp.ncbi.nlm.nih.gov/geo/series/GSE12nnn/GSE12345/suppl/GSE12345_RAW.tar; 5. 在Linux终端中输入rsync命令下载数据,如:rsync -avP rsync://ftp.ncbi.nlm.nih.gov/geo/series/GSE12nnn/GSE12345/suppl/GSE12345_RAW.tar . 方法三:使用Aspera Connect下载GEO数据 1. 打开NCBI GEO网站(https://www.ncbi.nlm.nih.gov/geo/); 2. 在搜索框中输入GEO数据的ID,如GSE12345; 3. 在搜索结果页面中点击“FTP”按钮,进入FTP页面; 4. 点击“Aspera Connect”按钮,下载并安装Aspera Connect客户端; 5. 在Linux终端中输入ascp命令下载数据,如:ascp -QT -l 300m -P 33001 -i /path/to/aspera/connect/etc/asperaweb_id_dsa.openssh era-connect://ftp.ncbi.nlm.nih.gov/geo/series/GSE12nnn/GSE12345/suppl/GSE12345_RAW.tar .。 以上是三种下载NCBI GEO数据的方法,希望能帮到您。
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值