Solution 1
这道题之前上的自然语言处理课上讲过,所以印象比较深。而且我们当时上课的更加复杂,还包括一种相邻两个位置交换的情形。
实际上这道题就是一个动态规划,我们把子问题简化到只考虑当前两个字符串的考察字符之间的调整,那么就有两个情况:
- 二者相同,那么当前考察位置上不做调整。
- 二者不同,执行(第二个字符串相对于第一个字符串的)增加、删除、替换操作。
那么最优子结构 ans [ i ] [ j ] \operatorname{ans}[i][j] ans[i][j] 定义为:第一个字符串的前 i i i 个字符于第二个字符串的前 j j j 个字符进行比较的最小编辑距离。对应上述两种情况:
- 如果 word1 [ i ] = = word2 [ j ] \operatorname{word1}[i] == \operatorname{word2}[j] word1[i]==word2[j],那么当前考察位置不会引入额外的编辑操作,即 ans [ i ] [ j ] = ans [ i − 1 ] [ j − 1 ] \operatorname{ans}[i][j] = \operatorname{ans}[i - 1][j - 1] ans[i][j]=ans[i−1][j−1]
- 否则,需要考虑(第二个字符串相对于第一个字符串的)的增加、删除、替换操作引入的编辑距离,三者分别对应 ans [ i ] [ j − 1 ] \operatorname{ans}[i][j - 1] ans[i][j−1] (考察到当前位置,相对于前一个状态多了一个第二个字符串的增加操作)、 ans [ i − 1 ] [ j ] \operatorname{ans}[i - 1][j] ans[i−1][j] (考察到当前位置,相对于前一个状态多了一个第一个字符串的删除操作)以及 ans [ i − 1 ] [ j − 1 ] \operatorname{ans}[i - 1][j - 1] ans[i−1][j−1] (替换以保证二者相同),即 ans [ i ] [ j ] = min { ans [ i ] [ j − 1 ] + 1 , ans [ i − 1 ] [ j ] + 1 , ans [ i − 1 ] [ j − 1 ] + 1 } \operatorname{ans}[i][j] = \min \{ \operatorname{ans}[i][j - 1] + 1, \operatorname{ans}[i - 1][j] + 1, \operatorname{ans}[i - 1][j - 1] + 1\} ans[i][j]=min{ans[i][j−1]+1,ans[i−1][j]+1,ans[i−1][j−1]+1}
初始化边界条件,就是其中一个是空串的情形,那编辑距离就是另外一个非空字符串的长度(一直加到相同)。
- 时间复杂度: O ( m n ) O(mn) O(mn),其中 m m m和 n n n分别为两个输入字符串的长度,二维遍历
- 空间复杂度: O ( m n ) O(mn) O(mn),其中 m m m和 n n n分别为两个输入字符串的长度,需要记录整个遍历过程中的所有结果(实际上不用……)
class Solution {
public:
int minDistance(string word1, string word2) {
int len1 = word1.size();
int len2 = word2.size();
vector<vector<int>> ans(len1 + 1, vector<int>(len2 + 1, 0)); // DP数组尺寸 len1+1 * len2+1
// 初始化,任意长字串到空串的编辑距离为非空长度
for (int i = 0; i <= len1; i++) {
ans[i][0] = i;
}
for (int i = 0; i <= len2; i++) {
ans[0][i] = i;
}
for (int i = 1; i <= len1; i++) {
for (int j = 1; j <= len2; j++) {
if (word1[i - 1] == word2[j - 1]){
ans[i][j] = ans[i - 1][j - 1];
} else {
// 增加、删除、修改
ans[i][j] = min(ans[i][j - 1], min(ans[i - 1][j], ans[i - 1][j - 1])) + 1;
}
}
}
return ans[len1][len2];
}
};
Solution 2
Solution 1的Python实现
class Solution:
def minDistance(self, word1: str, word2: str) -> int:
ans = [[0] * (len(word2) + 1) for i in range(len(word1) + 1)]
for i in range(len(word1) + 1): ans[i][0] = i
for i in range(len(word2) + 1): ans[0][i] = i
for i in range(1, len(word1) + 1):
for j in range(1, len(word2) + 1):
if word1[i - 1] == word2[j - 1]: ans[i][j] = ans[i - 1][j - 1]
else: ans[i][j] = min(ans[i][j - 1], ans[i - 1][j], ans[i - 1][j - 1]) + 1
return ans[len(word1)][len(word2)]