本地blast与nr/nt库

步骤一:NT/NR库全库下载

用wget 对数据库进行下载

NT/NR库:https://ftp.ncbi.nlm.nih.gov/blast/db/

NT库有76个子文件构建成NT全库

NR库有63个子文件构建成NR全库

(ncbi网站处理好的文件,不需要建库)

https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nt.gz

https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nr.gz

这两个为nr/nt的fasta文件,需要建库

写一个简单的脚本,对nr/nt库进行下载

#!/bin/bash
for i in {00..76}
do
    wget -c https://ftp.ncbi.nlm.nih.gov/blast/db/nt.${i}.tar.gz
    wget -c https://ftp.ncbi.nlm.nih.gov/blast/db/nt.${i}.tar.gz.md5
    md5sum -c nt.${i}.tar.gz.md5
    tar -zxvf nt.${i}.tar.gz -C
    echo "nt.${i} has done."
done
#!/bin/bash
for i in {00..63}
do
    wget -c https://ftp.ncbi.nlm.nih.gov/blast/db/nr.${i}.tar.gz
    wget -c https://ftp.ncbi.nlm.nih.gov/blast/db/nr.${i}.tar.gz.md5
    md5sum -c nr.${i}.tar.gz.md5
    tar -zxvf nr.${i}.tar.gz -C
    echo "nr.${i} has done."
done

注意:下载的时候要加-c参数,避免因网络问题下载失败

下载完后注意删除安装包

步骤二:把序列与nt/nr库进行比对

基本用法

蛋白质序列比对蛋白质数据库(blastp)

blastp -query seq.fast -out seq.blast -db dbname -outfmt 7 -evalue 1e-5 -num_des
criptions 10 -num_threads 8

核酸序列比对核算数据库(blastn)

blastn -query seq.fasta -out seq.blast -db dbname -outfmt 7 -evalue 1e-5 -num_descriptions 10 -num_threads 8

核酸序列比对蛋白质数据库(blastx)

blastx -query seq.fasta -out seq.blast -db dbname -outfmt 7 -evalue 1e-5 -num_descriptions 10 -num_threads 8

参数:
-query: 输入文件路径及文件名
-out:输出文件路径及文件名
-db:格式化了的数据库路径及数据库名
-outfmt:输出文件格式,总共有12种格式,6是tabular格式对应BLAST的m8格式
-evalue:设置输出结果的e-value值
-num_descriptions:tabular格式输出结果的条数
-num_threads:线程数

创建索引数据库

makeblastdb -in mouse.faa -dbtype nucl -input_type fasta -out dna

参数:
-in: 输入数据库文件
-dbtype:数据库类型 如果是蛋白质数据库则 nucl改为 prot
-out: 索引数据库名称

创建索引文件

dustmasker -in Nuc.fasta -infmt fasta -parse_seqids -outfmt maskinfo_asn1_bin -out Nuc_all.asnb

参数:
in:输入数据库文件
-infmt:输入文件的格式
-parse_seqids:解析序列的id,这个只需要提供参数,不要提供文件名
-outfmt:输出文件的格式,直接填写即可maskinfo_asnl_bin即可。
out:输出文件的文件名(索引文件名)。

创建数据库

makeblastdb -in Nuc.fasta -input_type fasta -dbtype nucl -parse_seqids -mask_data NucDatsBase.asnb -out Nuc_all

参数:
in:原本我们数据库的文件
input_type:输入文件的格式,很明显,我这里是fasta格式
 

  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值