Leetcode 编辑距离解答
题目理解:
给你两个单词 word1 和 word2, 请返回将 word1 转换成 word2 所使用的最少操作数 。你可以对一个单词进行如下三种操作:
插入一个字符
删除一个字符
替换一个字符
解题思路:
-
标准的动态规划
-
dp[i] [j] 表示以下标i-1为结尾的字符串word 1,和以下标j-1为结尾的字符串word 2,最近编辑距离为dp[i] [j]。
-
对“dp[i-1] [j-1] 表示替换操作,dp[i-1] [j] 表示删除操作,dp[i] [j-1] 表示插入操作。”的补充理解:
以 word 1 为 “horse”,word 2 为 “ros”,且 dp[5] [3] 为例,即要将 word 1的前 5 个字符转换为 word 2的前 3 个字符,也就是将 horse 转换为 ros,因此有:
(1) dp[i-1] [j-1],即先将 word 1 的前 4 个字符 hors 转换为 word 2 的前 2 个字符 ro,然后将第五个字符 word 1[4](因为下标基数以 0 开始) 由 e 替换为 s(即替换为 word 2 的第三个字符,word 2[2])
(2) dp[i] [j-1],即先将 word 1 的前 5 个字符 horse 转换为 word 2 的前 2 个字符 ro,然后在末尾补充一个 s,即插入操作
(3) dp[i-1] [j],即先将 word 1 的前 4 个字符 hors 转换为 word 2 的前 3 个字符 ros,然后删除 word 1 的第 5 个字符
-
这里只考虑单边,也就是以word 1作为目标字符串,对word 1进行修改,插入,删除,替换,三种操作取最小。
程序展示:
class Solution {
public:
int minDistance(string word1, string word2) {
int m = word1.size();
int n = word2.size();
// 定义dp[i][j] : 作为截止到下表为i的字符串转换为下标为j的字符串所需要的最少次数
vector<vector<int>> dp(m+1, vector<int>(n+1, 0));
// 当其中一个为空,另外一个字串,长度就是所需要的最少距离
for (int i = 0; i <= word1.size(); i++) dp[i][0] = i;
for (int j = 0; j <= word2.size(); j++) dp[0][j] = j;
// 遍历字符串
for(int i = 1; i <= m; i++){
for(int j = 1; j <= n; j++){
// 当两个字符串对应哪个位置一样的时候,编辑距离不改变。
if(word1[i-1] == word2[j-1]){
dp[i][j] = dp[i-1][j-1];
}
// 这里涉及到 删除word1,删除word2,因为增加word1就相当于删除word2,因此四种情况就相当于两种情况。还有就是替换。
// dp[i][j-1]: 表示word1[0--i]全部字符转换为word2[0--j-1],最后在补充一个字符,也就是添加操作,这里全部以word1作为参考。dp[i-1][j],将word1的前i-1个字符转为word2全部字符,最后将word1最后的字符删除,所需要的最少操作数。dp[i-1][j-1]: 将word1最后一个字符替换为word2最后一个字符,那么所需要的操作数就是【i-1】【j-1】的操作数加上一。因此这三种操作最小值加上一就是【i】[j]的编辑距离
if(word1[i-1] != word2[j-1]){
dp[i][j] = min({dp[i-1][j], dp[i][j-1],dp[i-1][j-1]}) + 1;
}
}
}
return dp[m][n];
}
};
总结:时间和空间复杂度: O ( m n ) , 因 为 需 要 遍 历 所 有 字 符 , 也 就 是 两 层 循 环 , 再 加 上 二 维 数 组 。 O(mn),因为需要遍历所有字符,也就是两层循环,再加上二维数组。 O(mn),因为需要遍历所有字符,也就是两层循环,再加上二维数组。