Question
Given two words word1 and word2, find the minimum number of steps required to convert word1 to word2. (each operation is counted as 1 step.)
You have the following 3 operations permitted on a word:
a) Insert a character
b) Delete a character
c) Replace a character
本题难度Hard。
DP
【复杂度】
时间 O(MN) 空间 O(MN)
【思路】
这是算法导论中经典的一道动态规划的题。假设dp[i-1][j-1]
表示一个长为i-1
的字符串str1
变为长为j-1
的字符串str2
的最短距离,如果我们此时想要把str1a
这个字符串变成str2b
这个字符串,我们有如下几种选择:
- 替换: 在
str1
变成str2
的步骤后,我们将str1a
中的a
替换为b
,就得到str2b
(如果a
和b
相等,就不用操作) - 增加: 在
str1a
变成str2
的步骤后,我们再在末尾添加一个b
,就得到str2b
(str1a
先根据已知距离变成str2
,再加个b
) 删除: 在
str1
变成str2b
的步骤后,对于str1a
,我们将末尾的a
删去,就得到str2b
(str1a
将a
删去得到str1
,而str1
到str2b
的编辑距离已知)然后从中选出最小值作为
dp[i][j]
的值即可。
【解释】
我一开始看到这个解法的第一反应是这怎么能解?比如:
从word1="bbbbbaaa"
变到word2="aaa"
,很明显只要把word1
的"bbbbb"
删去就可以。DP能行吗?实际上在dp矩阵中,我们可以看到操作所对应的变化:
对于我们说的这个例子实际上只要从dp[4][0]
一路走替换路线(实际上不用替换,这条路线是“捷径”)就可以:
那么如果我们把所有矩阵单元全部算一遍实际上就是所有可能都试过了,最后的当然是最优的。本质上就是找到一条从dp[0][0]
到dp[m][n]
的路径,该路径要尽最大可能走“捷径”。
【代码】
public class Solution {
public int minDistance(String word1, String word2) {
//require
int m=word1.length(),n=word2.length();
int[][] dp=new int[m+1][n+1];
for(int i=0;i<m+1;i++)
dp[i][0]=i;
for(int i=0;i<n+1;i++)
dp[0][i]=i;
//invariant
for(int i=1;i<m+1;i++)
for(int j=1;j<n+1;j++){
//add op
int addition=dp[i][j-1]+1;
//delete op
int deletion=dp[i-1][j]+1;
//replace
int replace=(word1.charAt(i-1)==word2.charAt(j-1))?dp[i-1][j-1]:dp[i-1][j-1]+1;
dp[i][j]=Math.min(replace,Math.min(addition,deletion));
}
//ensure
return dp[m][n];
}
}
参考
[Leetcode] Edit Distance 最小编辑距离(它的两个递推公式写错了,分别应该为dp[i][j] = min(dp[i-1][j]+1, dp[i][j-1]+1, dp[i-1][j-1])
和dp[i][j] = min(dp[i-1][j]+1, dp[i][j-1]+1, dp[i-1][j-1]+1)
)