题目:
给定两个字符串。计算这两个字符串的编辑距离。可编辑方式包含3种:插入、删除、替换。
解题思路:
考虑使用动态规划来解题。用output[i][j]来保存word1[0:i]和word2[0:j]的编辑距离。则output[i][j]可以由output[i-1][j],output[i][j-1],output[i-1][j-1]来获得。若word1[i]==word2[j],则可以不做任何编辑,或者在原来基础上删除或插入,output[i][j] = min(output[i-1][j-1],output[i-1][j]+1,output[i][j-1]+1)。否则只能删除、替换、或者插入output[i][j] = min(output[i-1][j-1]+1,output[i-1][j]+1,output[i][j-1]+1)。这两句的意思都是在当前可选择的操作上选择最终编辑距离最小的作为当前的编辑距离。
代码(Python):
class Solution(object):
def minDistance(self, word1, word2):
"""
:type word1: str
:type word2: str
:rtype: int
"""
M = len(word1)
N = len(word2)
output = [[0]*(N+1) for i in range(M+1)]
for i in range(M+1):
for j in range(N+1):
if i==0 and j==0:
output[i][j]=0
elif i==0 and j!=0:
output[i][j] = j
elif i!=0 and j==0:
output[i][j] = i
elif word1[i-1]==word2[j-1]:
output[i][j] = min(output[i-1][j-1],output[i-1][j]+1,output[i][j-1]+1)
else:
output[i][j] = min(output[i-1][j-1]+1,output[i-1][j]+1,output[i][j-1]+1)
return output[M][N]