概述
Damerau–Levenshtein Distance用来测量两个字符序列之间的编辑距离的字符串度量标准。两个词的Damerau–Levenshtein Distance是从一个词转换为另一个词的最少操作数,与Levenshtein Distance不同的是,除了单个字符的插入、删除和变更之外,还包括两个相邻字符的转换。
定义
对于两个字符串、
,函数
表示
的前
个字符与
的前
个字符的编辑距离:
当 时,除了要计算Levenshtein Distance中所定义的插入、删除和变更操作的操作数以外,还要计算相邻字符转换的操作数,然后将四个操作数做对比取最小的值。
示例
以字符串:aborad和
:aboard为例,求值过程如下图:
图片制作中。。。
如图字符串、
的Damerau–Levenshtein Distance
为1,相似度
为: