LeetCode 583. 两个字符串的删除操作
题目链接:583. 两个字符串的删除操作 - 力扣(Leetcode)
从题面上看,通过删除最少的两个字符串的一些字符,使得两个字符串相同,可以反过来找两个字符串的最长公共子序列,分别用他们的长度减去这个公共子序列的长度,就能得到问题的解。
class Solution {
public:
int minDistance(string word1, string word2) {
// 找两个字符串的最长公共子序列
int m = word1.length();
int n = word2.length();
vector<vector<int>> dp(m+1, vector<int>(n+1));
int result = 0;
for(int i=1; i<=m; i++){
for(int j=1; j<=n; j++){
if(word1[i - 1] == word2[j - 1]){
dp[i][j] = dp[i - 1][j - 1] + 1;
}
else{
dp[i][j] = max(dp[i - 1][j], dp[i][j - 1]);
}
result = max(result, dp[i][j]);
}
}
return m + n - 2 * result;
}
};
和之前做过的公共子序列问题类似,时间和空间复杂度都是O(mn)。
上面的做法通过求解最长公共子序列反向求解最少删除次数,讲解中用动态规划的思路正向思考,将dp数组定义为以word1[i-1]为结尾的word1和以word2[j-1]为结尾的word2要达到相等所需的最少删除次数,word1[i - 1] == word2[j - 1]时,对应字符不需要删除,dp[i][j] = dp[i-1][j-1];而 word1[i - 1] != word2[j - 1],要考虑三种情况:删除word1[i-1]、删除word2[j-1]以及两个都删除,最后的结果就是取其中的最小值:
class Solution {
public:
int minDistance(string word1, string word2) {
int m = word1.length();
int n = word2.length();
vector<vector<int>> dp(m+1, vector<int>(n+1));
// 正向思路,dp[i][j]表示
// 以word1[i-1]为结尾的word1和以word2[j-1]为结尾的word2要达到相等所需的最少删除次数
// 此时返回值需要为dp[m][n]
// 并且dp[i][0]和dp[0][j]均需要初始化(其中一个字符串为空,那么最少删除次数等于另一个字符串的长度)
// dp[0][0] = 0(都不用删)
for(int i = 0; i <= m; i++) dp[i][0] = i;
for(int j = 1; j <= n; j++) dp[0][j] = j;
for(int i=1; i<=m; i++){
for(int j=1; j<=n; j++){
if(word1[i - 1] == word2[j - 1]){
dp[i][j] = dp[i - 1][j - 1];
}
else{
dp[i][j] = min(min(dp[i - 1][j] + 1, dp[i][j - 1] + 1), dp[i - 1][j - 1] + 2);
}
}
}
return dp[m][n];
}
};
一个容易忽略的是dp数组的初始化问题,第一行和第一列对应一个空字符串和一个非空字符串之间的删除,因此需要根据非空字符串的长度初始化删除次数。
LeetCode 72. 编辑距离
沿着上一题的思路,增加了对两个字符串添加字符和替换字符的操作。删除的操作比较容易理解,比如两个字符串遍历到的字符不相等时,要么删除word1[i-1],dp[i][j]就从dp[i-1][j]转移过来;要么删除word2[j-1],dp[i][j]从dp[i][j-1]转移过来。自己尝试推导状态转移公式时,没想清楚如果是替换字符,dp[i][j]应该从哪个状态转换过来,看讲解后理解了,就是替换其中一个字符为另一个时,如果word1[i-1]==word2[j-1],dp[i][j]=dp[i-1][j-1],即当前不操作所需的最少次数,为了让word1[i-1]==word2[j-1]需要额外加一个替换操作,因此dp[i][j]=dp[i-1][j-1] + 1。又因为增加字符和删除字符的操作数是相同的,可以认为删除其中一个字符时已经考虑了增加的情况。最终代码实现如下:
class Solution {
public:
int minDistance(string word1, string word2) {
// 对word1和word2都能操作
int m = word1.length();
int n = word2.length();
// dp数组:dp[i][j]表示将以word1[i-1]结尾的word1转换为
// 以word2[j-1]为结尾的word2所需的最少操作次数
vector<vector<int>> dp(m + 1, vector<int>(n + 1));
// 初始化
for(int i = 0; i <= m ; i++) dp[i][0] = i;
for(int j = 0; j <= n ; j++) dp[0][j] = j;
// int result = INT_MAX;
// 遍历
for(int i = 1; i <= m; i++){
for(int j = 1; j <= n; j++){
if(word1[i - 1] == word2[j - 1]){
// 不用操作
dp[i][j] = dp[i-1][j-1];
}
else{
// dp[i-1][j], dp[i][j-1], dp[i-1][j-1]
// 分别对应删除word1[i-1]、删除word2[j-1]、替换其中一个字符为另一个三种情况
dp[i][j] = min(min(dp[i-1][j], dp[i][j-1]), dp[i-1][j-1]) + 1;
}
}
}
return dp[m][n];
}
};
编辑距离总结篇
经过前面一系列子序列问题的铺垫,编辑距离理解起来倒是没那么抽象了,这个刷题顺序可以说真的很有效!