每天更新一道python or C++ leetcode题,力求讲解清晰准确,客官们可以点赞或者关注。
题目:
给定两个单词 word1 和 word2,计算出将 word1 转换成 word2 所使用的最少操作数 。
你可以对一个单词进行如下三种操作:
- 插入一个字符
- 删除一个字符
- 替换一个字符
示例 1:
输入: word1 = "horse", word2 = "ros" 输出: 3 解释: horse -> rorse (将 'h' 替换为 'r') rorse -> rose (删除 'r') rose -> ros (删除 'e')
示例 2:
输入: word1 = "intention", word2 = "execution" 输出: 5 解释: intention -> inention (删除 't') inention -> enention (将 'i' 替换为 'e') enention -> exention (将 'n' 替换为 'x') exention -> exection (将 'n' 替换为 'c') exection -> execution (插入 'u')
算法过程:使用dp法,并用二维数组储存之前的结果。
dp[i][j]表示word1的前i个字符(包括i)与word2的前j个字符(包括j)的编辑距离。
主要思路是既然最终答案,也就是word1与word2的编辑距离比较复杂,于是我们就一步一步来,逐步利用之前的结果去求解。
动态方程:
1.当i或j有一项为0时,也就是一个空字符串对另一个字符串,所以最短编辑距离就是这2个字符串长度的最大值。
2.当第i个字符与第j个字符相等时,也就是word1[i-1] == word2[j-1]为true时,这时候这一位我们是不会打算动的,因为要求的是最小的编辑距离,当前的字符不需要动,只需要动前面的字符即可,也就是dp[i][j] = dp[i-1][j-1]。
3.其他的情况,也就是i,j都不为0,并且第i个字符与第j个字符不等的情况。
dp[i][j] = min(dp[i-1][j-1], dp[i][j-1],dp[i-1][j]) + 1 ,这段代码比较难理解。
我的理解是当前dp[i][j]分以下几种情况:
a.把word1[i]或者 word2[j]改成对方的字符,这种的话为dp[i-1][j-1] + 1
b.把word1[i] 删掉或增加一个字符, 所以这种为dp[i-1][j]+1
c.把word2[j]删掉或增加一个字符,dp[i][j-1]+1
也就是说实际上我们所做的不过是讨论了每一步编辑距离的所有可能的操作,然后取了最小的那个,符合题意。
算法证明:(超详细)
- 在第一行与第一列肯定是正确的,这也很好理解,例如我们将kitten转换为空字符串,我们需要进行的操作数为kitten的长度(所进行的操作为将kitten所有的字符丢弃)。
- 我们对字符可能进行的操作有三种:
- 如果我们可以使用k个操作数把s[1…i]转换为t[1…j-1],我们只需要把t[j]加在最后面就能将s[1…i]转换为t[1…j],操作数为k+1
- 如果我们可以使用k个操作数把s[1…i-1]转换为t[1…j],我们只需要把s[i]从最后删除就可以完成转换,操作数为k+1
- 如果我们可以使用k个操作数把s[1…i-1]转换为t[1…j-1],我们只需要在需要的情况下(s[i] != t[j])把s[i]替换为t[j],所需的操作数为k+cost(cost代表是否需要转换,如果s[i]==t[j],则cost为0,否则为1)。
- 将s[1…n]转换为t[1…m]当然需要将所有的s转换为所有的t,所以,d[n,m](表格的右下角)就是我们所需的结果。
class Solution:
def minDistance(self, word1, word2):
"""
:type word1: str
:type word2: str
:rtype: int
"""
m = len(word1)
n = len(word2)
dp = [[0 for _ in range(m+1)] for _ in range(n+1)]
for i in range(n+1):
for j in range(m+1):
if i == 0:
dp[i][j] = j
elif j == 0:
dp[i][j] = i
elif word1[j-1] == word2[i-1]:#当前字符相等,于是看前面的字符串的编辑距离
dp[i][j] = dp[i-1][j-1]
else:
#取所有可能操作中最小的
dp[i][j] = min(dp[i-1][j-1], dp[i-1][j], dp[i][j-1])+1
return dp[-1][-1]
C++
class Solution {
public:
int minDistance(string word1, string word2) {
int n1 = word1.size(), n2 = word2.size();
int dp[n1 + 1][n2 + 1];
for (int i = 0; i <= n1; ++i) dp[i][0] = i;
for (int i = 0; i <= n2; ++i) dp[0][i] = i;
for (int i = 1; i <= n1; ++i) {
for (int j = 1; j <= n2; ++j) {
if (word1[i - 1] == word2[j - 1]) {
dp[i][j] = dp[i - 1][j - 1];
} else {
dp[i][j] = min(dp[i - 1][j - 1], min(dp[i - 1][j], dp[i][j - 1])) + 1;
}
}
}
return dp[n1][n2];
}
};