三者之间的共同之处就是 BlastN/Megablast/Discontiguous megablast 都是BlastN,就是核酸序列比对核酸序列的算法。
简单而言
BlastN : 不那么灵敏,相似度较低的序列也可以查找到,所以比对的速度慢,但允许更短序列的比对(如短到7个碱基的序列)。
MEGABLAST : 采用贪婪式算法,速度较一般blast快,通常用于从数据库中查找非常相似的序列, 运行速度快,灵敏度高。同一物种间的。
Discontiguous MEGABLAST : 灵敏度更高,用于更精确的比对。主要用于跨物种之间的同源比对。
详细解释
1. MEGABLAST 常被用于鉴定核酸序列
MEGABLAST is the tool of choice to identify a nucleotide sequence.
MegaBLAST也是一种BLASTN程序,不过它主要是用来在非常相似的序列之间(来自同一物种)比对同源性的。
鉴定某一段核酸序列是否存在于数据库,最好的方法是选择MEGABLAST。如果比对到的序列在数据库中注释完整的话,那该序列丰富的注释可以当作 新序列的参考。当然,BlastN/MEGABLAST/Discontiguous MEGABLAST,都可以完成这种事情。但MEGABLAST就是特别设计用于非常相似序列之间的比对,可用于寻找查询序列的最佳匹配的序列。
2. Discontiguous MEGABLAST 更好地用于查找不同物种的相似的核酸序列,而不是与查询序列相同物种的。
Discontiguous MEGABLAST is better at finding nucleotide sequences similar, but not identical, to your nucleotide query.
Discontiguous MEGABLAST,用于跨物种核酸序列快速比对。它使用非重叠群字段匹配算法(noncontiguous word match)来进行核酸比对。Discontiguous MegaBLAST比blastx等翻译后比对要快得多,同时它在比较编码区时也具有相当高的敏感度。
Discontiguous MEGABLAST详细介绍:
www.ncbi.nlm.nih.gov/blast/discontiguous.html
BLAST页面使用
从blastn页面上的简单帮助可以看到Highly similar sequences (megablast)多用于比较相似性比较高(相似性在95%以上)的序列,速度快;More dissimilar sequences (discontiguous megablast)用于相似性稍低于megablast的比对,但是灵敏度和精确度更高,多用于不同物种间的同源比对;而Somewhat similar sequences (blastn)用于比对相似性较差的序列,可以比对最短7个碱基的长度,所以比对精确度最高,比对结果最多,速度最慢。