ncbi-genome-download批量下载基因组数据

本文详细介绍了如何使用ncbi-genome-download工具从NCBI批量下载基因组数据,包括根据属名、物种ID和拉丁名下载的方法,以及核查下载情况和处理未成功下载的文件。
摘要由CSDN通过智能技术生成

1. ncbi-genome-download 的下载和安装

ncbi-genome-download 是一个可以直接从NCBI上批量下载序列的软件,支持下载多种格式

利用 conda 对其直接安装 参考

#创建环境
conda create -n ncbi_genome_download
#激活环境
conda activate ncbi_genome_download
# 安装
conda install -c bioconda ncbi-genome-download

2.常用的参数

  • -s:选择数据库(genbank,refseq),默认是refseq数据库
  • -F:需要下载基因组的格式,可以多种格式同时下载,用逗号隔开,默认是genbank格式
  • -l:序列组装程度,可以多种格式同时下载,用逗号隔开
  • -g:需要下载序列的属,后面要指定类群,比如bacteria
  • S:下载的具体的菌种名称,用逗号隔开,也可以写入一个文件中,一行一个菌种名称
  • -o:输出的文件名称
  • -r:失败时重新连接的次数,默认是0次
  • --flat-output:将下载的文件输入到一个目录中,不创建新的子文件(即下载的数据在指定的文件夹中,每个 Taxonomy ID 一个压缩文件)

参数详情:

(ncbi_genome_download) [hgzhong@head01 ~]$ ncbi-genome-download -h                                                               
usage: ncbi-genome-download [-h] [-s {refseq,genbank}] [-F FILE_FORMATS]                                                         
                            [-l ASSEMBLY_LEVELS] [-g GENERA] [--genus GENERA]                                                    
                            [--fuzzy-genus] [-S STRAINS] [-T SPECIES_TAXIDS]                                                     
                            [-t TAXIDS] [-A ASSEMBLY_ACCESSIONS]                                                                 
                            [--fuzzy-accessions] [-R REFSEQ_CATEGORIES]                                                          
                            [--refseq-category REFSEQ_CATEGORIES] [-o OUTPUT]                                                    
                            [--flat-output] [-H] [-P] [-u URI] [-p N] [-r N]                                                     
                            [-m METADATA_TABLE] [-n] [-N] [-v] [-d] [-V]                                                         
                            [-M TYPE_MATERIALS]                                                                                  
                            groups                                                                                               
                                                                                                                                 
positional arguments:                                                                                                            
  groups                The NCBI taxonomic groups to download (default: all).                                                    
                    
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值