官网:https://www.ibm.com/products/aspera
先去官网下载压缩包
#安装
tar zxfv ibm-aspera-connect_4.1.0.46-linux_x86_64.tar.gz
bash xxx.sh
#添加环境变量
echo 'export PATH=$PATH:~/.aspera/connect/bin/' >> ~/.bashrc
source ~/.bashrc
安装好以后就可以下载了,先试一下
#下载
ascp -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -l 100M -T -P33001 -k 1 era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/ERR899/ERR899393/ERR899393_1.fastq.gz ./
#-i 免密从NCBI或EBI下载的私钥,安装完成就有,位于#~/.aspera/connect/etc/asperaweb_id_dsa.openssh
#-l 最大下载速度,如100M
#-k 断点续传,通常设为1
#-T 无需加密传输
#-P 用于SSH认证的TCP商品,一般是33001
aspera下载fastq的时候需要特殊的url链接,如下图中,下载TSV文件,其中就有fasp.sra.ebi.ac.uk开头的链接,只需要在前面加上era-fasp@即可下载
EBI中fastq下载界面
TSV文件
note:
下载报错原因1:未加输出位置,在下载代码的最后需要加./,以确定下载的文件的保存位置。
下载报错原因2:未使用正确的链接,我看过其他教程说把ftp开头的下载链接去掉开头,加上era-fasp@fasp.sra.ebi.ac.uk:修改为Aspera所需格式,这种修改我试过,可能会导致链接错误,最好的办法就是下载上面讲到的TSV文件中专门的Aspera格式链接。
下载报错原因3:数据库可能进行了维护。
附NCBI和千人基因组的下载方法
#NCBI
ascp -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -l 100M -k1 -T -P33001 anonftp@ftp.ncbi.nlm.nih.gov:/refseq/release/viral/viral.2.1.genomic.fna.gz .
#EBI千人基因组
ascp -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -l 100M -T -k1 -P33001 fasp-g1k@fasp.1000genomes.ebi.ac.uk:/vol1/ftp/release/20100804/ALL.2of4intersection.20100804.genotypes.vcf.gz .