如何下载NCBI的ftp数据
因为要从refseq中下载数据,知道 ftp 地址,浏览器打不开,用了好多下载工具都下不下来,所以有点难受。。。
一般的 ftp 下载链接是长这样的:
ftp://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/001/696/305/GCF_001696305.1_UCN72.1
但无意间找到NCBI的FQA,所以找到了下载的方法(手动狗头)
主要的方法就是:把下载链接开头的 ftp 替换成 rsync,然后用 rsync 进行传输
这个也是可以使用通配符
rsync --copy-links --recursive --times --verbose rsync://ftp.ncbi.nlm.nih.gov/genomes/all/*/*fa my_dir/
如果 对原文感兴趣,可以自己到 NCBI 的 FAQ 中自己查看。
NCBI 下载地址: https://ftp.ncbi.nlm.nih.gov/
NCBI 问题集合:https://www.ncbi.nlm.nih.gov/genome/doc/ftpfaq/