NCBI Genome Download 项目推荐
1. 项目基础介绍和主要编程语言
NCBI Genome Download 是一个用于从NCBI FTP服务器下载基因组数据的Python脚本项目。该项目由kblin开发并维护,旨在简化从NCBI下载细菌和真菌基因组的过程。项目的主要编程语言是Python,支持Python 3.7及以上版本。
2. 项目核心功能
该项目的主要功能包括:
- 基因组下载:支持从NCBI下载细菌和真菌的基因组数据,包括RefSeq和GenBank格式。
- 多格式支持:可以下载多种格式的基因组数据,如FASTA、assembly-report等。
- 多组支持:支持同时下载多个基因组组,如细菌、病毒等。
- 过滤功能:可以根据基因组的完成度、分类级别、参考类别等进行过滤下载。
- 并行下载:支持多线程并行下载,提高下载效率。
3. 项目最近更新的功能
最近更新的功能包括:
- 模糊匹配:新增了
--fuzzy-genus
选项,允许用户进行模糊匹配,以便更灵活地匹配基因组名称。 - 类型材料过滤:新增了
--type-materials
选项,允许用户根据“relation to type material”列进行过滤下载。 - 人类可读目录结构:新增了
--human-readable
选项,可以在下载基因组数据的同时创建人类可读的目录结构。 - 干运行模式:新增了
--dry-run
选项,允许用户在不实际下载的情况下查看哪些基因组将被下载。
这些更新进一步增强了项目的功能性和灵活性,使其能够更好地满足用户的需求。