欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘!
基因学苑Q群:32798724
前面我们介绍了如何进行生物数据的检索,当得到了数据的下载地址之后,接下来就可以开始下载了,那么下载数据的方式有很多种,最常用的就是使用浏览器进行下载,不过浏览器使用的是http(s)协议,下载速度慢,而且如果突然中断,断点续传也比较麻烦,这次我们介绍更好用的ftp协议下载方式。
FTP下载
FTP 是File Transfer Protocol(文件传输协议)的英文简称,相比于http协议,更加稳定,传输速度也更快。
很多网站提供ftp协议的数据下载。
#例如ncbi的ftp地址为:
ftp://ftp.ncbi.nlm.nih.gov/
#embl的ftp地址为:
ftp://ftp.ensembl.org/pub/
访问ftp服务器需要四个元素。
ftp的地址,
用户名和密码,可以匿名访问,Anonymous,也就是数据是公开的,不需要要填写。
端口号,ftp默认端口号是21,一般也不用填写;
连接工具,有很多工具,这里面我们使用filezilla作为演示。
其实ftp的地址是可以直接通过浏览器或者资源管理器进行访问的。通过浏览器访问非常不方便,不能直接下载整个文件夹,而且不能断点续传。
通过windows系统的资源管理器,也可以访问,那么就是这种文件夹的形式,这个看起来比较工整,可以直接拖拽文件夹,但是访问速度比较忙。

本文介绍了如何使用FTP协议下载生物数据,特别是从NCBI下载人全基因组参考序列和gff文件。推荐使用FileZilla作为FTP工具,详细步骤包括添加FTP地址、浏览目录和拖拽文件到本地。注意NCBI的目录结构可能变动,需确认下载版本。
最低0.47元/天 解锁文章
5312

被折叠的 条评论
为什么被折叠?



