一、问题描述
设A和B是两个字符串,长度分别为n,m要用最少的字符操作(包括字符的插入、删除、修改),这样的操作称为字符串A到B的操作距离,记为d(A,B)。
二、思路分析
把求解编辑距离分为字符串A从0个字符逐渐增加到全部字符分别要变成字符串B该如何变化的问题。具体来说就是,首先选用str1来存储字符串A,str2来存储字符串B,distance矩阵来进行具体的运算。考虑到最简单的情况,str1的长度为0,str2长度不为0;str1长度不为0,str2长度为0,对前一种情况的编辑距离就是m,后一种则是n。为什么?因为str1为0的时候要么对str1进行添加,即添加m位的str2,要么对str2进行m个删除操作;str2为0的时候,要么对str1进行n个删除操作,要么对str2进行n个添加操作。接下来我们着重考虑一般情况,distance矩阵为[n][m],假定我们从distance[0][0]开始一直操作到了distance[i][j]位置,其中删除操作肯定是str1比str2长,插入操作str1比str2短,我们所要做的是对distance[i-1][j] 、distance[i][j-1]、distance[i-1][j-1]存的数进行比较,其中最小的就是当前str1和str2的编辑距离。
三、实现过程
这里,我们把矩阵抽象出来,