问题描述:
给定两个字符串word1, word2,返回从word1转换到word2所需操作的最小值
操作包括:
1.插入一个字符
2.删除一个字符
3.替换一个字符
例:
问题解析:
解决该问题的核心在于找出转移算式。对于指向word1,word2的下标i,j:
当word1[i] == word2[j]时,表明无需进行操作,此时所需操作的最小值应与 (i-1, j-1)时相同;
而word1[i] != word2[j]时,则需分三种情况讨论:
1)回到(i-1, j-1),然后替换word1[i]为word2[j];
2)回到(i-1, j), 然后删除word1[i];
3)回到(i, j-1),然后插入word2[j];
而转移公式即这三者中所需操作的最小值加上1(新的操作)
代码:
int minDistance(string word1, string word2) {
int n = word1.size(), m = word2.size();
// set n+1, m+1 for the usage of dp[i][0]
vector<vector<int>> dp(n+1, vector<int>(m+1, 0));
//initialize
for(int j = 0; j <= m; ++j) {
dp[0][j] = j;
}
for(int i = 1; i <= n; ++i) {
dp[i][0] = i;
for(int j = 1; j <= m; ++j) {
if(word1[i-1] == word2[j-1]) {
dp[i][j] = dp[i-1][j-1];
}
else {
dp[i][j] = min(dp[i-1][j-1], min(dp[i-1][j], dp[i][j-1])) + 1;
}
}
}
return dp[n][m];
}
这里需要注意的是,考虑到i若代表的是word1的下标,则i-1无意义,因此在代码中i对应的其实是word1中的实际下标(从1开始),i==0则表示word1是空串时的情况,此时的状态转换则不需要加入新的边界判断。
Further more:
观察代码,我们每次更新都只用到了dp[i-1][j-1], dp[i-1][j]和dp[i][j-1]这三个变量,因此可以压缩二维dp为一维数组,利用两个int进行数据的保存和更新。
代码如下:
int minDistance(string word1, string word2) {
int n = word1.size(), m = word2.size();
vector<int> dp(m+1, 0);
//initialize
for(int j = 0; j <= m; ++j) {
dp[j] = j;
}
int pre = dp[0], tmp = 0;
for(int i = 1; i <= n; ++i) {
dp[0] = i;
for(int j = 1; j <= m; ++j) {
tmp = dp[j];
if(word1[i-1] == word2[j-1]) {
dp[j] = pre;
}
else {
dp[j] = min(pre, min(dp[j], dp[j-1])) + 1;
}
pre = tmp;
}
pre = dp[0];
}
return dp[m];
}