编辑距离(LD)计算两个字符串相似度

【定义】设A和B是两个字符串。将字符串A转换为字符串B所用的最少字符操作数称为字符串A到字符串B的编辑距离。( 这里所说的字符操作包括:删除一个字符,插入一个字符,修改一个字符)

求编辑距离和两个字符串相似度

算法的原理就不做赘述了,记录一下从拿到两个字符串到计算出两个字符串相似度的计算过程。

首先,会有两个字符串这里举例

A串为:GAATTCAGTTA

B串为:GGATCGA


LD具有下列性质:

LD(A,A)=0

LD(A,"")=Len(A)

LD(A,B)=LD(B,A)

0≤LD(A,B)≤Max(Len(A),Len(B))

LD(A,B)=LD(Rev(A),Rev(B))

LD(A+C,B+C)=LD(A,B)

LD(A+B,A+C)=LD(B,C)

LD(A,B)≤LD(A,C)+LD(B,C)

LD(A+C,B)≤LD(A,B)+LD(B,C)


有了这些,然后我们来说一些定义:

A=a1a2……aN,表示A是由a1a2……aN这N个字符组成,Len(A)=N

B=b1b2……bM,表示B是由b1b2……bM这M个字符组成,Len(B)=M

LD(i,j)=LD(a1a2……ai,b1b2……bj),其中0≤i≤N,0≤j≤M

有了这些,不难得到,LD(N,M)=LD(A,B),,,LD(0,0)=0,,,LD(0,j)=j,,,LD(i,0)=i

对于1≤j

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值