利用linux系统进行blast比对,linux服务器上的blast比对(my version:ncbi-blast-2.8.1+)...

一:安装blast

1. 下载blast:$wget ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ncbi-blast-2.9.0+-x64-linux.tar.gz

2. 解压:$tar zxvf ncbi-blast-2.6.0+-x64-linux.tar.gz

3. 将blast添加进环境$vim ~/.bashrc

$export PATH=/data1/spider/ytbiosoft/ncbi-blast-2.8.1+/bin:$PATH (不加的话就全路径调用)

4. 调用.bashrcsource  ~/.bashrc

blast安装完成,可以blastn -version查看你的版本。

二:建database

确保安装好了本地blast之后,下载想要的序列建库(以下以nr,nt建库为例).

1. 建库:

核酸$nohup makeblastdb -in nt -input_type fasta -dbtype nucl -parse_seqids -out nt -logfile nt.log &     建议挂后台

蛋白序列$nohup makeblastdb -in nr -input_type fasta -dbtype prot -parse_seqids -out nr -logfile nr.log &    建议挂后台

2. 比对$blastx -query *.fasta -db nr -out out.file.name

$blastn -query *.fasta -db nt -out out.file.name

一些比对的参数:-query

需要比对的序列

-db

建立好的数据库名

-out

输出文件的名字

-evalue

evalue值(默认10)

-outfmt 【6=Tabular,11= BLAST archive (ASN.1)】

输出文件格式【一般选6或11】

-num_threads

线程数

输出的文件形式也可以选择其他:

fcfd44206cd9?utm_campaign=maleskine&utm_content=note&utm_medium=seo_notes&utm_source=recommendation

##用diamond建库比对更快(只限于比对蛋白数据库)$diamond makedb --in nr.fa -d nr

$diamond blastx -d nr -q *.fasta -o out.file.name

3. 查看输出结果(我输出的是11,asn格式)

fcfd44206cd9?utm_campaign=maleskine&utm_content=note&utm_medium=seo_notes&utm_source=recommendation

4. 如果你输出6的话如下:

fcfd44206cd9?utm_campaign=maleskine&utm_content=note&utm_medium=seo_notes&utm_source=recommendation

会生成12列的tabular格式文件,每一列代表的是啥如下:

1. qseqid query (e.g., gene) sequence id

2. sseqid subject (e.g., reference genome) sequence id

3. pident percentage of identical matches

4. length alignment length

5. mismatch number of mismatches

6. gapopen number of gap openings

7. qstart start of alignment in query

8. qend end of alignment in query

9. sstart start of alignment in subject

10. send end of alignment in subject

12. bitscore bit score

5. 最后你可以把你想要的那一列或几列提取出来:$cat file.name |awk '{print $n}' > new.file.name    [$n: 你需要那列n就是几]

6. 你也可以对生成的文件按第4列长度排序:$cat file.name |sort -n -r -k4 > new.file.name.sort  [k4:代表第四列alignment length]

最后欢迎联系我互相交流,我也是学习。909474045@qq.com

  • 2
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: NCBI-BLAST-2.13.0-win64是一种基于谷氨酰胺脲和其他生物信息学技术的序列比对软件包。这个软件被广泛用于分析DNA,RNA和蛋白质序列,使得比对过程能够更加快速精确。该软件中包含了多个工具,如核酸和蛋白质序列比对,重排序,序列相似性搜索,基于模板的序列比对等。 NCBI-BLAST-2.13.0-win64具有许多特性和功能,例如可以查询各种序列数据库,对于不同的序列类型具有不同的比对策略,可以进行加速计算和多进程处理,支持多种输出格式,可以进行本地安装等等。此外,其还具有自定义参数和调整比对参数等高级设置。 该软件包已经成为生物医学研究中的重要工具之一,用于生物数据处理、统计学分析以及建立模型和预测。NCBI-BLAST-2.13.0-win64能够帮助研究人员更好的理解生物序列之间的相似性,从而推断其功能和进化关系。这对于进行生物大数据分析和快速挖掘生物信息,为生物医学研究提供更多帮助的重要性无法忽视。 ### 回答2: NCBI-BLAST-2.13.0 -win64 是一款开源软件,是 National Center for Biotechnology Information (NCBI) 提供的序列比对工具之一。该软件适用于 Windows 64 位操作系统,可以在命令行下运行。其中,BLAST 是 Basic Local Alignment Search Tool 的缩写,指的是基本局部比对搜索工具,常用于在大量的生物序列中寻找相似的序列NCBI-BLAST-2.13.0 -win64 支持多种输入文件格式,包括 FASTA、GenBank、EMBL 等。它可以对两种或多种序列之间进行 BLAST 分析,查找它们之间的相似性和差异性。与其他序列比对软件相比,NCBI-BLAST-2.13.0 -win64 具有高速度、高准确度、灵活性等特点。此外,它也可以进行多种参数的自定义设置,以适应不同的比对需求。 总之,NCBI-BLAST-2.13.0 -win64 是一款强大的生物信息学工具,可以帮助研究者在大量的生物序列数据中寻找相似的序列,从而推测它们的结构、功能、演化关系等重要信息,为生物学研究提供有力支持。 ### 回答3: ncbi-blast-2.13.0 -win64是一个基于NCBI平台开发的Blast程序的版本号,在Windows操作系统下可用。Blast是一种用于生物信息学研究的算法,用于比对和分析DNA、RNA和蛋白质序列NCBI-Blast是由美国国家医学图书馆(National Library of Medicine)所提供的一个全球著名的互联网爬虫、文献检索和生物信息资源的网站。NCBI-Blast提供了多个版本,用于不同的平台和操作系统NCBI-Blast-2.13.0 -win64是专门为Windows 64位操作系统设计开发的版本。它具有以下特点:可以快速比对大规模的DNA、RNA和蛋白质序列;提供多种比对算法,可以根据需要选择适合的算法;支持本地计算机和远程服务器,方便用户按照不同的需求进行使用。总之,NCBI-Blast-2.13.0 -win64是专门为方便Windows 64位用户利用Blast算法比对和分析生物序列而开发的一个工具,可以极大地提高生命科学研究的效率。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值