Basic Local Alignment Search Tool
Year: 1990
Authors: Stephen F. Altschul, Warren Gish, Webb Miller, Eugene W. Myers and David J. Lipman
Journal Name: Journal of Molecular Biology
Abstract
一个快速进行序列比较的新方法:基本局部比对搜索工具( basic local alignment search tool, BLAST ),直接近似比对,通过优化局部相似度:最大部分对( maximal segment pair, MSP )分数。关于 MSP 分数随机性质的最新数学结果允许了分析该方法的表现和生成的比对统计显著性。这个基本算法简单并且鲁棒,它能以多种方式实施并且能应用于多种环境,包括直接的 DNA 和蛋白质序列数据集搜索、 motif 搜索、基因识别搜索、以及分析长 DNA 序列中的多个区域相似度。除对数学分析的灵活性和易处理性之外, BLAST 比现有的相似灵敏度的序列分析工具快的多。
Method
作者从两个序列中切割相同长度,切割的边界由最大化相似度分数获得,组成最大分割对( maximal segment pair, MSP )。只要两子序列的相似度分数不能随着子序列长度的增加或减少而增大,就定义为局部分割对。
定义长度为
w
w
w 的 word 对, BLAST 的主要策略就是只计算包含分数大于
T
T
T 的 word 对的分割对。
算法总共分为三步
- 编译高分 words 列表
- 扫描数据集中的“命中”
- 扩展上述“命中”
在扩展阶段,当分数低于之前找到的最大值一段距离时,停止扩展。