基础局部比对搜索工具(BLAST)详解
1. BLAST 算法简介
BLAST 算法是一种用于进行序列相似性搜索的新方法,它比 FASTA 算法更快,同时保持了相当的灵敏度。美国国立医学图书馆(NCBI)建立了一个专门运行 BLAST 的强大计算机系统。用户可以通过互联网(http://www.ncbi.nlm.nih.gov/)以网站形式访问该 BLAST 系统,也可以通过 BLAST 电子邮件服务器进行访问。此外,还有许多其他网站也提供 BLAST 数据库搜索服务。
除了 NCBI 开发的 BLAST 程序外,华盛顿大学也开发了一套独立的 BLAST 程序。这些程序使用与 NCBI - BLAST 相同的方法进行相似性搜索,并生成带空位的局部比对结果。不过,用于评估序列相似性得分的统计方法有所不同,因此 WU - BLAST 和 NCBI - BLAST 可能会产生不同的结果。
1.1 BLAST 与 FASTA 的比较
BLAST 和 FASTA 都通过先搜索查询序列和每个数据库序列中的共同单词或 k - 元组来提高序列比对的速度。但 FASTA 会搜索所有相同长度的可能单词,而 BLAST 则将搜索范围限制在最具显著性的单词上。对于蛋白质序列,显著性是通过使用 BLOSUM62 氨基酸替换矩阵中的对数优势得分来评估这些单词匹配确定的。在 BLAST 算法中,蛋白质的单词长度固定为 3(以前为 4),核酸的单词长度为 11(如果序列在所有六个阅读框中翻译,则为 3)。理论上,FASTA 对 DNA 序列数据库的搜索更灵敏,因为它可以使用更短的单词长度。
1.2 BLAST 算法的发展阶段
BLAST 算法经
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



