在阅读文献过程中,看到很多存储在SRA的数据想要下载,SRA Tools和Aspera用的比较多,但使用上以及下载速度上各有各的看法吧,下面提供一种傻瓜式下载方法,linux系统和windows系统都行,当然linux系统下更稳定一些。
阅读文献中读到了,数据存储在NCBI的PRJNA229517。
首先,我们去 https://www.ebi.ac.uk/ 搜索PRJNA229517。(为什么不去搜NCBI?我理解就是美国有的,欧洲做了个备份,并且欧洲这边提供了ftp的下载方式,而NCBI上没有找到。)
这里可以看到该项目下的所有fastq文件和SRA文件,点击即可下载,无需安装什么软件,下载速度的话就因人而异。
如果想下载该项目下的所有fastq.gz文件,只需点击TSV处,将表格下载下来,里面带有所有目标文件的下载地址。
然后用wget -c命令下载即可,如:
wget -c ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR153/004/SRR1534154/SRR1534154_1.fastq.gz ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR153/004/SRR1534154/SRR1534154_2.fastq.gz
这样SRR1534154的双末端测序文件就都下载下来了。
在这个TSV文件基础上修改下,很快可以做成个sh文件,运行即可。
如果你特别喜欢用aspera,里面也提供了aspera的ftp下载地址。
wget -c下载一般还是比较快的,并且-c支持了断点续传。