LeetCode——072.编辑距离

72.编辑距离

题目

给你两个单词 word1 和 word2,请你计算出将 word1 转换成 word2 所使用的最少操作数 。

你可以对一个单词进行如下三种操作:

插入一个字符
删除一个字符
替换一个字符
 

示例 1:

输入:word1 = "horse", word2 = "ros"
输出:3
解释:
horse -> rorse ('h' 替换为 'r')
rorse -> rose (删除 'r')
rose -> ros (删除 'e')
示例 2:

输入:word1 = "intention", word2 = "execution"
输出:5
解释:
intention -> inention (删除 't')
inention -> enention ('i' 替换为 'e')
enention -> exention ('n' 替换为 'x')
exention -> exection ('n' 替换为 'c')
exection -> execution (插入 'u')

来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/edit-distance
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。

题解思路

1>源代码

class Solution:
    def minDistance(self, word1: str, word2: str) -> int:
        n = len(word1)
        m = len(word2)

        # 有一个字符串为空串
        if n * m == 0:
            return n + m

        # DP 数组
        DP = [[0] * (m + 1) for _ in range(n + 1)]

        # 边界状态初始化
        for i in range(n + 1):
            DP[i][0] = i
        for j in range(m + 1):
            DP[0][j] = j

        for i in range(1, n+1):
            for j in range(1, m+1):
                if (word1[i-1] == word2[j-1]):
                    DP[i][j] = 1 + min(DP[i - 1][j], DP[i][j - 1], DP[i - 1][j - 1] - 1)
                else:
                    DP[i][j] = 1 + min(DP[i - 1][j], DP[i][j - 1], DP[i - 1][j - 1])
        return DP[n][m]

2>算法介绍

本题不愧为困难题,我可谓是踩了很多坑。首先来分析一下题目,他要求我们求出两个字符串之间的编辑距离,允许我们增、删、改字符。在我经过了LeetCode的洗礼后,我很快就想到了使用动态规划的思路。令DP[i][j]表示表示 A 的前 i 个字母和 B 的前 j 个字母之间的编辑距离。很明显:

DP[0][0] = 0
DP[i][0] = i
DP[0][j] = j。

然后我们从DP[1][1]开始分析,存在两种情况:

  1. A的第一个字符和B的第一个字符相同,DP[1][1] = 0
  2. A的第一个字符和B的第一个字符不相同,DP[1][1] = 1

那么DP[i][j]呢?如果我们能得到DP[i-1][j], DP[i][j-1], DP[i-1][j-1],就相当于我们得到了以下三种情况:


DP[i-1][j]DP[i][j-1]DP[i-1][j-1]
向A中插入一个元素就能得到B从A中删除一个元素就能得到B对A的末尾修改一个元素就能得到B

于是我们得出:

# A和B此时的最后一个元素相同
DP[i][j] = min(DP[i - 1][j] + 1, DP[i][j - 1] + 1, DP[i - 1][j - 1] - 1 + 1)

# A和B此时的最后一个元素不同
DP[i][j] = min(DP[i - 1][j] + 1, DP[i][j - 1] + 1, DP[i - 1][j - 1] + 1)

化简即可得到代码中的DP数组求解方法。

动态规划的情况有的时候容易把脑子想乱,在混乱纠结的时候不妨举一个比较简单明了的例子,例如本题中我们举例:

A = ‘ab’ B = ‘ac’

j\i012
0012
11
22

初始状态如上。当i = 1, j = 1时,A和B的字符相同,也就意味着不需要任何操作。

从公式的角度来说也不存在问题。

j\i012
0012
110
22

当i = 1, j = 2时,A的字符为a,B的字符为c,不相同,此时DP[1][2] = DP[1][1] + 1

相当于我们知道了A = a, B = a时候的编辑距离,那么我们就必然知道A = a, B = ac时候的编辑距离,因为只需要在A中加一个c即可。

i\j012
0012
1101
22

往后也是同理,这一步DP[2][1] = DP[1][1] + 1

相当于我们知道了A = a, B = a时候的编辑距离,那么我们就必然知道A = ab, B = a时候的编辑距离,因为只需要在A中删掉一个b即可。

i\j012
0012
1101
221

DP[2][2] = DP[1][1] + 1

这一步相当于我们知道了A = a, B = a时候的编辑距离,那么我们就必然知道A = ab, B = ac时候的编辑距离,因为只需要在A中把b改成c即可。

i\j012
0012
1101
2211

经过这样的推导,是不是对这个算法更加清晰了呢?

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值