实践版基因测序构建本地NT库(NCBI)(多个压缩包)

基因测序进行大量数据blast,为了节省时间,可以构建本地nt库,避免再到网页一步步检索。

1、下载nt库

#查看可下载的NCBI资源库

update_blastdb.pl --showall

#自动下载所需nt库(如用Perl工具,即:perl update_blastdb.pl nt)

update_blastdb.pl nt

#Aspera下载(速度快)

ascp -l -k 1 -T -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh  anonftp@ftp.ncbi.nlm.nih.gov:/blast/db/FASTA/nt.gz ./

2、校验检查包是否缺损

#统计数据压缩包

md5sum nt.00.tar.gz

#查看校验包

 cat nt.00.tar.gz.md5

3、校验后,进行合并和解压

#文件合并
cat nt.*.tar.gz > nt.tar.gz
#解压
tar -zxvf nt.tar.gz

4、构建索引

makeblastdb -in  nt -dbtype nucl -parse_seqids -out ntout

5、利用nt库进行blast

 

blastn -query query.fna -db ntout  -out blastn.out -outfmt 0 -num_threads 40 -evalue 1e-5 

备注:本文自动下载使用blast工具,下载方法。

#下载blast软件包选择2.7.1版本
 wget -c ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ncbi-blast-2.12.0+-x64-linux.tar.gz
#解压到当前blast文件夹
tar –zxvf ncbi-blast-2.12.0+-x64-linux.tar.gz –C /datd/appseq/blast/
#将软件配置环境变量
echo "PATH=$PATH:/data/appseq/blast/ncbi-blast-2.12.0+/bin" >> ~/.bashrc
#刷新环境变量
source ~/.bashrc
#检查软件安装
which blastn
blastn -version 

细菌16S rRNA基因测序数据的上传至NCBI SRA数据是非常重要的。SRA(Sequence Read Archive)是一个公共数据,它存储了各种生物的DNA和RNA测序数据,包括细菌。下面我将解释为什么要将细菌16S rRNA基因测序数据上传至NCBI SRA数据。 首先,通过将16S rRNA基因测序数据上传至NCBI SRA数据,可以实现数据的共享和开放。科研人员可以从中共享和获取数据,提高科学研究的效率和可信度。这种共享可以促进各种细菌基因组学研究的进展,并促使更多的研究人员参与进来。 其次,通过上传数据至NCBI SRA数据,可以提高数据的可靠性和复现性。对科研成果的复现是科学研究的基石,它可以验证实验结果的准确性和可信度。当同一份数据被共享并上传至NCBI SRA数据时,其他研究人员可以验证和重复原来的研究,从而增加了数据的可靠性。 此外,将细菌16S rRNA基因测序数据上传至NCBI SRA数据,也有利于相关研究的引用和参考。其他研究人员可以引用和参考已上传的数据,从而推动整个领域的研究进程,提高科学研究的质量和影响力。 综上所述,细菌16S rRNA基因测序数据应上传至NCBI SRA数据是为了实现数据的共享、提高数据的可靠性和复现性,以及促进相关研究的引用和参考。这将对于细菌基因组学研究的发展和推动具有积极的意义。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值