Leetcode Algorithm 072. Edit Distance
Edit Distance
给定两个字符串,求出它们的编辑距离。编辑距离是指两个字符串上下排列时,其字母不同的列数的最小值,也就是把一个字符串变成另外一个字符串的最少编辑操作次数。编辑操作包括:插入、删除、替换一个字符。
解题思路
这个其实是《算法概论》中第159页的一个例题,为了避免考虑字符串对齐的各种的复杂情况,可以用动态规划来解决。
想用动态规划来解决这个问题的话,我们必须先要找到这个问题的子问题。
假设有两个字符串word1[1:m]
和word2[1:n]
,如果我们能知道它们的前缀word1[1:i]
和word2[1:j]
的编辑距离,当i=m
以及j=n
时,就是我们想要的答案。
我们用E(i,j)
来表示word1[1:i]
和word2[1:j]
的编辑距离,关键是考虑word1[1:i]
和word2[1:j]
对齐时,最后一个字符的情况,显然有三种情况:
word1[1:i-1]
和word2[1:j-1]
已经对齐了,编辑距离是E(i-1, j-1)
。假如word1[i]==word2[j]
,则E(i, j)=E(i-1, j-1)
,即无需编辑;假如word1[i]!=word2[j]
,则E(i, j)=E(i-1, j-1)+1
,即要把word2[j]
替换成word1[i]
。word1[1:i-1]
和word2[1:j]
已经对齐了,编辑距离是E(i-1, j)
。那么要想word1[1:i]
和word2[1:j]
对齐,word2[1:j]
必须插入一个与word1[i]
相等的字符。word1[1:i]
和word2[1:j-1]
已经对齐了,编辑距离是E(i, j-1)
。那么要想word1[1:i]
和word2[1:j]
对齐,word2[1:j]
必须删除word2[j]
。
总结起来,E(i, j)
就是从这三种情况中选择最优的情况,即E(i, j) = min(E(i-1, j-1)+diff(i, j), E(i-1, j)+1, E(i, j-1)+1)
,其中,如果word1[i]==word2[j]
,diff(i, j)=1
,否则diff(i, j)=0
。
剩下的是初始值的问题,即处理E(0, 0), E(i, 0), E(j, 0)
的值。
E(0, 0)
表示两个空串的编辑距离,即E(0, 0)=0
。E(i, 0)
表示一个非空串和一个空串的编辑距离,要在空串中插入i个字符,即E(i, 0)=i
。- 同理,
E(i, 0)=j
。
代码
#include<iostream>
using namespace std;
class Solution {
public:
int minDistance(string word1, string word2) {
int m = word1.size();
int n = word2.size();
int E[m + 1][n + 1];
for (int i = 0; i <= m; i++) {
E[i][0] = i;
}
for (int j = 0; j <= n; j++) {
E[0][j] = j;
}
for (int i = 1; i <= m; i++) {
for (int j = 1; j <= n; j++) {
int diff = word1[i - 1] == word2[j - 1] ? 0 : 1;
E[i][j] = min(E[i - 1][j - 1] + diff,
min(E[i - 1][j] + 1, E[i][j - 1] + 1));
}
}
return E[m][n];
}
};
测试样例
int main() {
Solution s;
cout << s.minDistance("exponential", "polynomial") << endl;
return 0;
}
输出
6