本周算法课讲的是动态规划(dynamic programming),所谓动态规划,就是把一个大的问题的求解转化为求解它的子问题。也就是说,首先需要定义目标的子问题,以子问题的解答支持大问题求解,先求出一系列子问题的解,最终即可求出大问题的解。针对动态规划这一算法,有很多经典的例子帮助我们更好的理解它,比如书上提到的编辑距离(Edit Distance)。因此,本周的题目就是来自LeetCode上面难度为Hard的72题Edit Distance。题目要打的代码不多,也很容易理解,关键难在算法的思想,即如何运用动态规划的思想求解编辑距离这一问题。
一、问题描述
二、问题分析
根据题目要求,一个操作是指删除,插入或者替换一个字符。而我们要求的目标是最少的操作次数,即编辑距离。如何思考这道题呢?首先,我们定义‘_’(空字符)也是一个字符,并且在两个单词中可以插入若干’_‘来达到最终两个单词长度一致。接着,思考这两个单词的最右边的字符(右对齐),或者单词1有字符,单词2为‘_’,那么也就代表单词1需要1次删除操作才可以变到单词2;如果单词1为‘_’,单词2有字符,那么单词1的最后一位需要1次插入操作才可以变到单词2;如果单词1单词2最右边都有字符,那么又分为两种情况:字符相同,那么最后一位无需任何操作变化;字符不同,则需要1次替换操作。这样一来,整个问题可以表示为最后一位的操作+前面若干位的操作;而把这种划分继续下去,前面若干位的操作又可以变为前面最后一位的操作+前面的前面若干位的操作。。。这样就达到了我们动态规划的目标:划分子问题,以子问题的解来支持最终问题的求解。注意,我们还要定义一下基准,即最小子问题。定义空串与其他字符串的距离为x(字符串长度),因此我们就有了伪代码:
三、问题求解
针对问题分析,以下是c++源代码:
class Solution {
public:
int minDistance(string word1, string word2) {
int m = word1.size(), n = word2.size();
int result[m + 1][n + 1];
for (int i = 0; i <= m; i++) {
result[i][0] = i;
}
for (int j = 1; j <= n; j++) {
result[0][j] = j;
}
for (int i = 1; i <= m; i++) {
for (int j = 1; j <= n; j++) {
result[i][j] = min3(result[i-1][j] + 1, result[i][j-1] + 1, result[i-1][j-1] + diff(word1[i-1], word2[j-1]));
}
}
return result[m][n];
}
int min3(int num1, int num2, int num3) {
return (num1 <= num2) ? (num1 <= num3 ? num1 : num3) : (num2 <= num3 ? num2 : num3);
}
int diff(char c1, char c2) {
return (c1==c2) ? 0 : 1;
}
};