1、题目描述
给你两个单词 word1 和 word2,请你计算出将 word1 转换成 word2 所使用的最少操作数 。
你可以对一个单词进行如下三种操作:
- 插入一个字符
- 删除一个字符
- 替换一个字符
python库
import Levenshtein
def get_edit_distance_score(sen1, sen2):
dis = Levenshtein.distance(sen1, sen2)
return dis / max(len(sen1), len(sen2))
2、代码详解
自底向上
class Solution:
def minDistance(self, word1: str, word2: str) -> int:
n1 = len(word1)
n2 = len(word2)
dp = [[0] * (n2 + 1) for _ in range(n1 + 1)]
# 第一行
for j in range(1, n2 + 1):
dp[0][j] = dp[0][j-1] + 1
# 第一列
for i in range(1, n1 + 1):
dp[i][0] = dp[i-1][0] + 1
for i in range(1, n1 + 1):
for j in range(1, n2 + 1):
if word1[i-1] == word2[j-1]:
dp[i][j] = dp[i-1][j-1]
else:
dp[i][j] = min(dp[i][j-1], dp[i-1][j], dp[i-1][j-1]) + 1
#print(dp)
return dp[-1][-1]
word1 = 'horse'
word2 = 'ros'
s = Solution()
print(s.minDistance(word1, word2)) # 3
dp[i][j]
代表 word1
到 i
位置转换成 word2
到 j
位置需要最少步数
即第一个字符串前 i 个字符,通过编辑,变成第二个字符串的前 j 个字符的最少操作次数
所以,
- 当
word1[i] == word2[j]
,dp[i][j] = dp[i-1][j-1]
- 当
word1[i] != word2[j]
,dp[i][j] = min(dp[i-1][j-1], dp[i-1][j], dp[i][j-1]) + 1
其中,
dp[i-1][j-1]
表示替换操作dp[i-1][j]
表示删除操作dp[i][j-1]
表示插入操作
注意,针对第一行,第一列要单独考虑,我们引入 ''
下图所示:
第一行,是 word1
为空变成 word2
最少步数,就是插入操作
第一列,是 word2
为空,需要的最少步数,就是删除操作