SMITH WATERMAN算法

本文介绍了生物信息学中用于序列相似性比较的Smith Waterman算法,该算法通过记分函数评估序列匹配程度,通过动态规划找到最优相似性比较,虽然计算复杂度高,但精度优于Blast算法。文章还探讨了算法的并行优化可能性。
摘要由CSDN通过智能技术生成

1.1 序列相似性比较

生物信息学中,对各种生物大分子序列进行分析是一件非常基本的工作。从序列的片段测定,拼接,基因的表达分析,到RNA和蛋白质的结构功能预测,物种亲缘树的构建都需要进行生物分子序列相似性的比较。在遗传物质长期的演化过程中,原本相同的DNA序列由于其中一条序列缺失了几个片断,或增加了几个片断,或某段子序列发生了位置的变化等,从而导致他们发生了不同,这两条序列不一定能进行精确的匹配,但是他们有一定的相似度。我们应该如何判定序列之间的这种相似性?对于这种情况,生物学家提出了一种用来评定序列相似性的方法,称为记分函数的方法。

定义1:如果Helps是一个序列,那么Helps表示中的字符长度,表示序列的第个字符。如果序列和序列相同,必须满足如下条件:

(1)、

(2)、

定义2:如果是两个字符,那么表示字符在进行比较时所得的分值,称为一个记分函数,记分函数还包括当为空字符或为空字符的情况,在序列中一个所谓的空字符表示序列中空字符的位置可能缺失一个未知的字符,我们只能使用空字符来表示这种缺失;

定义3:如果是两个序列,那么的一个相似性比较可以用来表示,其中:

(1)、

(2)、将中的空字符除去后所得的序列分别和相同;

相似性比较就是

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值