序列比对-levenshtein distance

一、两个字符串A和B,将A变为B需要经过最少几次编辑(包括插入、删除、替换)?
解决问题,俄罗斯人levenshtein设计了一个算法,名为levenshtein距离,具体如下:
levenshtein的具体算法是:
1. 获取字符串A的长度为n,获取字符串B的长度为m,如果m=0,返回n;如果n=0,返回m。
初始化一个二维数组D[m+1,n+1],将第一行填充为0至n,将第一列填充为0至m。注意这里的填充不是0。
2. 循环比对A的每一个字符与B的每一个字符。对于字符Ai与Bj,如果A[i]==B[j],那么cost为0,否则cost为1。这时比较二维数组D中的三个值:D[i-1,j]+1(左侧值+1), D[i,j-1]+1(顶部值+1), d[i-1,j-1]+cost(左上角+cost);这三个值分别代表删除,插入或者替换。取三个值中的最小值填充D[i,j]
3. 返回D数组最右下角D[m+1,n+1]的值就是levenshtein距离。
下面通过一个实例来进行说明:
求:atctg变为agct需要经过多少步骤?

  1. 取得两个字符串的长度,分别为5和4,并且创建一个二维数组[5,6]
  2. 开始比对:
    在这里插入图片描述
    可知,a=a.故cost=0,对比其左上和正左边以及正上方三个值,会发现左上的最小,所以加其加0,做为此补充位置的distance,如此类推,第二列补充完毕将是这样的:
    在这里插入图片描述



    如此补充完毕,得到其结果为:
    在这里插入图片描述
    所以,atctg变为agct需要经过两步,即1,把g换成t,在最后加上g。
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值