1. ncbi-genome-download 的下载和安装
ncbi-genome-download 是一个可以直接从NCBI上批量下载序列的软件,支持下载多种格式
利用 conda 对其直接安装 参考
#创建环境
conda create -n ncbi_genome_download
#激活环境
conda activate ncbi_genome_download
# 安装
conda install -c bioconda ncbi-genome-download
2.常用的参数
-s
:选择数据库(genbank,refseq),默认是refseq数据库-F
:需要下载基因组的格式,可以多种格式同时下载,用逗号隔开,默认是genbank格式-l
:序列组装程度,可以多种格式同时下载,用逗号隔开-g
:需要下载序列的属,后面要指定类群,比如bacteriaS
:下载的具体的菌种名称,用逗号隔开,也可以写入一个文件中,一行一个菌种名称-o
:输出的文件名称-r
:失败时重新连接的次数,默认是0次--flat-output
:将下载的文件输入到一个目录中,不创建新的子文件(即下载的数据在指定的文件夹中,每个 Taxonomy ID 一个压缩文件)
参数详情:
(ncbi_genome_download) [hgzhong@head01 ~]$ ncbi-genome-download -h
usage: ncbi-genome-download [-h] [-s {refseq,genbank}] [-F FILE_FORMATS]
[-l ASSEMBLY_LEVELS] [-g GENERA] [--genus GENERA]
[--fuzzy-genus] [-S STRAINS] [-T SPECIES_TAXIDS]
[-t TAXIDS] [-A ASSEMBLY_ACCESSIONS]
[--fuzzy-accessions] [-R REFSEQ_CATEGORIES]
[--refseq-category REFSEQ_CATEGORIES] [-o OUTPUT]
[--flat-output] [-H] [-P] [-u URI] [-p N] [-r N]
[-m METADATA_TABLE] [-n] [-N] [-v] [-d] [-V]
[-M TYPE_MATERIALS]
groups
positional arguments:
groups The NCBI taxonomic groups to download (default: all).