编辑距离(Edit Distance)

编辑距离(Minimum Edit Distance,MED),由俄罗斯科学家 Vladimir Levenshtein 在1965年提出,也因此而得名 Levenshtein Distance。Levenshtein Distance 是用来度量两个序列相似程度的指标。通俗地来讲,编辑距离指的是在两个单词<w_{1},w_{2}>之间,由其中一个单词w_{1}转换为另一个单词w_{2}所需要的最少单字符编辑操作次数。

 

单字符编辑操作有且仅有三种:

  • 插入(Insertion)
  • 删除(Deletion)
  • 替换(Substitution)

 

形式化定义

我们将两个字符串a,b 的 Levenshtein Distance 表示为lev_{a,b}(|a|,|b|) ,其中 |a||b| 分别对应 a,b的长度。那么,在这里两个字符串 a,b 的 Levenshtein Distance,即 lev_{a,b}(|a|,|b|) 可用如下的数学语言描述:

定义lev_{a,b}(i,j)  指的是 a 中前  i个字符和  b前  j个字符之间的距离。

 

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值