一、概念
编辑距离(Edit Distance):是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。
精准的定义就不多说了,直接上例子来理解这个编辑距离。编辑主要有三个操作:插入、删除、修改。例如:goood变为good,只需要删除一个o,因此编辑距离是1。gd变为god。只需要插入一个o,因此编辑距离是1。gwd变为god,只要修改w为o,因此编辑距离是1。
cutoff编辑距离(cut-off Edit Distance): 官方的概念我就不粘贴过来了,直接举个例子来说明什么是cutoff编辑距离。
例子如下:Y字符串是正确的字符串的一部分,X字符串是错误的字符串。两个字符串是从o开始不一样的。
计算cutoff编辑距离的过程:
(1) 令 n = length(Y) (n为Y字符串的长度)显然这里的n=4。令m = length(X) ,显然这里的m=7。
(2) 令low = max(1,n-t) t是阈值,这里的不妨令t=2。令up = min(m,n+t)。带入数值可以得出 low = 2,up = 6。到此步变为下图。意思就是从第2个字符开始到第6个字符截止进行计算。