- 本文关于如何在
NCBI
的FTP
里下载需要的基因组数据。
已知信息
- 例如:我从文献里看到作者测了 Escherichia coli ATCC 25922 的基因组,想从NCBI下载。
原文提供的信息是:
This Whole Genome Shotgun project has been deposited at DDBJ/EMBL/ GenBank under the accession number ASHD00000000. The version described in this paper is version ASHD01000000.
我们获得的关键信息:
- 物种和菌株名字:Escherichia coli ATCC 25922;
- Accession number:
ASHD00000000
; - Version:
ASHD01000000
。
理论
- 平时下载单条序列常常是直接从页面选择导出fasta文件,对于基因组则应该找到它在 FTP 中的位置,然后将整个文件夹下载下来。
实际操作
在
All database
里搜索Escherichia coli ATC