最快的下载方式是使用Aspera工具下载
但目前使用Aspera从NCBI上下载会出现连接失败的错误,加上端口命令依旧出错。
可以使用Aspera从ENA数据库中进行下载,且下载完成后直接是fastq压缩形式,不必再从sra格式转回fastq格式。
使用方法如下:
单个下载:
ascp -T -k 1 -l 200m -P 33001 -i ~/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/ERR769/ERR769508/ERR769508_1.fastq.gz ./
-
~/asperaweb_id_dsa.openssh
注意自己服务器上asperaweb_id_dsa.openssh的位置
-
era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq
从ENA数据库中下载连接这部分都是一样的,只需按照一样的格式变更SRA编号即可,若出现找不到文件的错误,可以直接去ENA数据库中搜索,复制下载地址,因为某些数据的下载地址中可能有其他数字编号,例如:/vol1/fastq/SRR105/033/SRR10592633/SRR10592633_1.fastq.gz。
-
./
代表下载到当前文件夹(加上下载位置是必要的)
批量下载:
ascp -T -k 1 -l 200m -P 33001 -i ~/asperaweb_id_dsa.openssh --mode recv --host fasp.sra.ebi.ac.uk --user era-fasp --file-list test ./Fungi/
-
test 文件
test是存放类似于:/vol1/fastq/ERR769/ERR769508/ERR769508_1.fastq.gz地址的文件,要单独成行。
可能的错误
之前可以正常使用的命令行突然不能用了,检查了环境配置以及asperaweb_id_dsa.openssh位置,确认没错,那可能是网速问题(基于他人的经验),或许等一段时间可以正常使用。
我已经等了一天了。。。。