重写了下,发现难的是想出dp[i][j]代表什么,这里是代表word1[:i]和word2[:j]的操作数。 具体的含义可以通过举例来更快速得到答案。 比如 123 和 1234 也就是 dp[i-1][j]的操作数,其实对应的就是插入;1234 vs 123,对应的就是删除。
两个for循环下,其实已经包含了word1的任意i到达word2的任意j,也就是说可以使用任意word1的前驱部分转化为word2。
删除: dp[i][j] = min(dp[i-1][j]+1, dp[i][j]
插入: dp[i][j] = min(dp[i][j-1]+1, dp[i][j])
替换: dp[i][j] = dp[i-1][j-1]+1
归结: dp[i][j] = min(dp[i-1][j], dp[i][j-1], dp[i-1][j-1]) + 1
还是通过表格,最直观可以了解到, 删除的话,那么其实就是相当于i-1已经做到的,此时i可以不用的情况;插入就是相当于原本i满足j-1了,此时插入就是满足等于word2[j]; 替换就很简单了~~
之前还有个疑惑是如果插入,那么是不是原来i这个位置的数会往后移动,其实不会的,此时插入是基于i位置已经被使用了的前提下的dp[i][j-1]: word1[0:i] — word2[0:j-1]。
所以本题的动态规划还是通过左上,左,上来传递的信息。这道题还有一个难点是必须dp是n+1的长度,考虑进 “”, 所以相当于每次比对的是word1[i-1]–word2[j-1].
class Solution:
# dp[i][j]代表word1[1:i]和word2[1:j]需要的最少的操作数
# 可以归结为 替换word1; 删除word1或删除word2。
# 插入的话就相当于删除了word2; 删除的话相当于
def minDistance(self, word1, word2):
if not word1 and not word2:
return 0
if not word1:
return len(word2)
if not word2:
return len(word1)
# dp[i][j] word1[:i] 和 word2[:j]相等所需要的最少操作数
dp = []
m = len(word1)
n = len(word2)
for i in range(m+1):
dp.append([0]*(1+n))
for i in range(1, m+1):
dp[i][0] = dp[i-1][0] + 1
for j in range(1, n+1):
dp[0][j] = dp[0][j-1] + 1
for i in range(1, m+1):
for j in range(1, n+1):
if word1[i-1] == word2[j-1]:
dp[i][j] = dp[i-1][j-1]
else:
# 只需要考虑当前就可以~如果是删除,那么就是dp[i-1][j]的情况决定;插入:dp[i][j-1]:那么其实考虑的是目前word1[0:i]和word2[0:j-1]的关系,因为插入一个和word2[j]相等的; 替换dp[i-1][j-1]
dp[i][j] = min(dp[i-1][j-1]+1, dp[i][j-1]+1, dp[i-1][j]+1)
return dp[-1][-1]