【583. 两个字符串的删除操作】
这题,还是用归纳法找到dp数组的递推公式。
当我们使用"sea"和"eat"这个测试用例的时候,我们的递推公式容易写成:
for(int i = 1; i <= word1.size(); i++){
for(int j = 1; j <= word2.size(); j++){
if(word1[i - 1] == word2[j - 1])dp[i][j] = dp[i - 1][j - 1];
else dp[i][j] = dp[i][j - 1] + 1;//错误
}
}
这样子是不对的,因为这个粒子没有考虑到当两个字符串新增的字符不相等的时候,之前的字符可能存在相等的情况。
当遇到测试用例“leetcode”和“etco”的时候,以上的代码就会算错。
所以重新考虑第二个测试用例,我们可以归纳出以下的递推公式:
for(int i = 1; i <= word1.size(); i++){
for(int j = 1; j <= word2.size(); j++){
if(word1[i - 1] == word2[j - 1])dp[i][j] = dp[i - 1][j - 1];
else dp[i][j] = min(dp[i][j - 1], dp[i - 1][j]) + 1;
}
}
这样就对了。
我们来解读一下递推公式。
首先确定dp数组和下标的定义:
dp[i][j]为以i-1为结尾的word1子串和以j-1为结尾的word2子串为了相等所需要删除的字符个数。
当word1[i - 1] == word2[j - 1]的时候,意味着遍历到当前字符相等了。那么他们俩都不需要删除,只需要看[i-1]和[j-1]下标所需要删除的字符的个数。这个容易理解。
当word1[i - 1] != word2[j - 1]的时候,意味着遍历到的当前字符不相等了。这里就分为两种情况。
1.word1的字符需要删除,word2的字符之前出现过需要保留,那么dp[i][j] = dp[i-1][j] + 1。
2.word1的字符之前出现过需要保留,word2的字符需要删除,那么dp[i][j] = dp[i][j - 1] + 1
这两种情况我们需要取最小值,尽可能去保留更多的字符。
最后整体的代码如下:
class Solution {
public:
int minDistance(string word1, string word2) {
vector<vector<int>>dp(word1.size()+1, vector<int>(word2.size()+1, 0));
for(int i = 1; i <= word1.size(); i++) dp[i][0] = i;
for(int i = 1; i <= word2.size(); i++) dp[0][i] = i;
for(int i = 1; i <= word1.size(); i++){
for(int j = 1; j <= word2.size(); j++){
if(word1[i - 1] == word2[j - 1])dp[i][j] = dp[i - 1][j - 1];
else dp[i][j] = min(dp[i][j - 1], dp[i - 1][j]) + 1;
}
}
return dp[word1.size()][word2.size()];
}
};
注意:状态转移函数只从dp[i-1][j-1]、dp[i][j-1]、dp[i-1][j]这三个方向来。
【72. 编辑距离】