如何下载NCBI的ftp数据

如何下载NCBI的ftp数据

因为要从refseq中下载数据,知道 ftp 地址,浏览器打不开,用了好多下载工具都下不下来,所以有点难受。。。
一般的 ftp 下载链接是长这样的:
ftp://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/001/696/305/GCF_001696305.1_UCN72.1
但无意间找到NCBI的FQA,所以找到了下载的方法(手动狗头)

主要的方法就是:把下载链接开头的 ftp 替换成 rsync,然后用 rsync 进行传输
这个也是可以使用通配符

rsync --copy-links --recursive --times --verbose rsync://ftp.ncbi.nlm.nih.gov/genomes/all/*/*fa my_dir/

如果 对原文感兴趣,可以自己到 NCBI 的 FAQ 中自己查看。

NCBI 下载地址: https://ftp.ncbi.nlm.nih.gov/
NCBI 问题集合:https://www.ncbi.nlm.nih.gov/genome/doc/ftpfaq/

好的,下面是三种下载NCBI GEO数据的方法: 方法一:使用wget命令下载GEO数据 1. 打开NCBI GEO网站(https://www.ncbi.nlm.nih.gov/geo/); 2. 在搜索框中输入GEO数据的ID,如GSE12345; 3. 在搜索结果页面中点击“FTP”按钮,进入FTP页面; 4. 复制FTP链接,如ftp://ftp.ncbi.nlm.nih.gov/geo/series/GSE12nnn/GSE12345/suppl/GSE12345_RAW.tar; 5. 在Linux终端中输入wget命令下载数据,如:wget ftp://ftp.ncbi.nlm.nih.gov/geo/series/GSE12nnn/GSE12345/suppl/GSE12345_RAW.tar。 方法二:使用rsync命令下载GEO数据 1. 打开NCBI GEO网站(https://www.ncbi.nlm.nih.gov/geo/); 2. 在搜索框中输入GEO数据的ID,如GSE12345; 3. 在搜索结果页面中点击“FTP”按钮,进入FTP页面; 4. 复制FTP链接,如ftp://ftp.ncbi.nlm.nih.gov/geo/series/GSE12nnn/GSE12345/suppl/GSE12345_RAW.tar; 5. 在Linux终端中输入rsync命令下载数据,如:rsync -avP rsync://ftp.ncbi.nlm.nih.gov/geo/series/GSE12nnn/GSE12345/suppl/GSE12345_RAW.tar . 方法三:使用Aspera Connect下载GEO数据 1. 打开NCBI GEO网站(https://www.ncbi.nlm.nih.gov/geo/); 2. 在搜索框中输入GEO数据的ID,如GSE12345; 3. 在搜索结果页面中点击“FTP”按钮,进入FTP页面; 4. 点击“Aspera Connect”按钮,下载并安装Aspera Connect客户端; 5. 在Linux终端中输入ascp命令下载数据,如:ascp -QT -l 300m -P 33001 -i /path/to/aspera/connect/etc/asperaweb_id_dsa.openssh era-connect://ftp.ncbi.nlm.nih.gov/geo/series/GSE12nnn/GSE12345/suppl/GSE12345_RAW.tar .。 以上是三种下载NCBI GEO数据的方法,希望能帮到您。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值