Blast 几种方法的具体用法以及含义

基本原理:对片段对的概念。所谓片段对是指两个给定序列中的一对子序列,它们长度相等,且可形成无空位完全匹配。

种类:

  1. Blastp:蛋白质序列去蛋白质数据库。
  2. Blastn:核酸序列去核酸数据库。
  3. Blastx:将核酸按照6条翻译成蛋白质序列再在蛋白质里进行搜索。

应用:主要对于核酸未知的序列,将其翻译成蛋白质序列再在蛋白质数据库搜索。

  1. tblastn:用蛋白质序列搜索核酸序列数据库,核酸数据库中按照6条翻译链翻译成蛋白质序列搜索。

应用:主要对未知的蛋白质序列进行搜索。蛋白质库中没有该序列,但是核酸数据库中可能有。

  1. tblastx:将核酸序列按照6条链翻译成蛋白质序列后搜索核酸序列数据库,数据库的中核酸序列按照6条链翻译成蛋白质序列再进行搜索。

应用:对于未知的核酸序列(利用6条链翻译成蛋白质序列a),利用核酸数据库进行翻译,然后得到蛋白质数据库(核酸数据库通过6条链翻译成蛋白质数据库A),再用a 在B中查找。与tblastn不同的是需要转义一步。

标准BLAST,PSI-BLAST(就近搜索,不断进行迭代),PHI-BLAST之间的示意图:

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Usage: /home/chenlianfu/chenlianfu_scripts/blast.pl [options] BLAST_DB file.fasta > out.txt --tmp-prefix default: blast 设置临时文件或文件夹前缀。默认设置下,程序生成command.blast.list,blast.tmp/等临时文件或目录。 --chunk default: 10 设置每个数据块的序列条数。程序会将输入FASTA文件中的序列从前往后分割成多份,每10条相邻的序列分配到一个FASTA文件中;在blast.tmp/临时文件夹下生成次级文件夹,每个文件夹做多放置10个FASTA文件;每个fasta文件写出一条BLAST命令到command.blast.list文件中;然后程序调用ParaFly进行并行化计算。 请注意:若数据块的数量超过100万个,默认设置下blast.tmp/文件夹中的目录数量太多(超过1万个),导致文件系统运行缓慢,ParaFly程序运行效率低下,无法充分利用服务器计算资源。此时推荐设置--chunk参数值为100。 --blast-program default: blastp 设置运行的BLAST命令,支持的命令有:blastn, blastp, blastx, tblastn, tblastx。 --CPU default: 1 设置并行运行的BLAST程序个数。 --blast-threads default: 1 设置BLAST命令的-num_threads参数值。该参数让每个BLAST命令可以多线程运行。 请注意:--blast-threads参数值和--CPU参数值的乘积不要超过服务器的CPU总计算线程数。 --evalue default: 1e-3 设置BLAST命令的-evalue参数值。 --outfmt default: 5 设置BLAST命令的-outfmt参数值。输出方式。若为5,则输出xml格式结果,若为6或7,则输出表格结果。 --max-target-seqs default: 20 设置BLAST命令的-max_target_seqs参数值。该参数设置BLAST最多能匹配数据库中的序列数量。 -clean 若添加该参数,则在运行程序成功后,会删除临时文件或文件夹。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值