题目地址(72. 编辑距离)

题目地址(72. 编辑距离)

https://leetcode.cn/problems/edit-distance/

题目描述

给你两个单词 word1 和 word2, 请返回将 word1 转换成 word2 所使用的最少操作数  。

你可以对一个单词进行如下三种操作:

插入一个字符
删除一个字符
替换一个字符

 

示例 1:

输入:word1 = "horse", word2 = "ros"
输出:3
解释:
horse -> rorse (将 'h' 替换为 'r')
rorse -> rose (删除 'r')
rose -> ros (删除 'e')


示例 2:

输入:word1 = "intention", word2 = "execution"
输出:5
解释:
intention -> inention (删除 't')
inention -> enention (将 'i' 替换为 'e')
enention -> exention (将 'n' 替换为 'x')
exention -> exection (将 'n' 替换为 'c')
exection -> execution (插入 'u')


 

提示:

0 <= word1.length, word2.length <= 500
word1 和 word2 由小写英文字母组成

前置知识

公司

  • 暂无

思路

关键点

代码

  • 语言支持:Python3

Python3 Code:


class Solution:
    def minDistance(self, word1: str, word2: str) -> int:
        """
        通过增、删、改来让word1等于word2
        尽可能地保留较长的顺序串
        采用动态规划的方法
        """
        n = len(word1)
        m = len(word2)
        
        # 如果有一个字符串为空串
        if n * m == 0:
            return n+m 
        
        # DP数组
        D = [[0]*(m+1) for _ in range(n+1)]

        # 边界状态初始化
        for i in range(n+1):
            D[i][0] = i
        for j in range(m+1):
            D[0][j] = j
        
        # word1逐渐变长
        for i in range(1,n+1):
            # word2逐渐变长
            for j in range(1,m+1):
                left = D[i-1][j]+1 # f(i-1,j)
                down = D[i][j-1]+1 # f(i,j-1)
                left_down = D[i-1][j-1] # f(i-1,j-1)
                if word1[i-1] != word2[j-1]:
                    left_down += 1
                D[i][j] = min(left_down,left,down)
        
        return D[n][m]
        

复杂度分析

令 n 为数组长度。

  • 时间复杂度 :O(mn),其中 m 为 word1 的长度,n 为 word2 的长度。

  • 空间复杂度 :O(mn),我们需要大小为 O(mn) 的 D 数组来记录状态值。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
编辑距离算法是一种常用的字符串相似度度量方法,它衡量两个字符串之间的差异程度。动态规划是解决编辑距离问题的常用方法之一。 编辑距离算法的目标是通过一系列的编辑操作(插入、删除、替换)将一个字符串转换成另一个字符串,使得转换的代价最小。代价可以通过插入、删除和替换操作的权重来定义,通常情况下插入和删除的代价为1,替换的代价为2。 动态规划算法解决编辑距离问题的思路是将原始问题分解为多个子问题,并利用子问题的最优解来求解原始问题的最优解。具体步骤如下: 1. 定义状态:假设两个字符串分别为s1和s2,定义dp[i][j]为将s1的前i个字符转换成s2的前j个字符所需要的最小编辑距离。 2. 初始化边界条件:将空字符串转换成任意字符串所需要的编辑距离为对应字符串的长度,即dp[0][j] = j,dp[i][0] = i。 3. 状态转移方程:根据题目要求和定义的状态,推导出状态转移方程。对于任意位置(i, j),有以下三种情况: - 若s1的第i个字符等于s2的第j个字符,则不需要进行编辑操作,编辑距离与dp[i-1][j-1]相同,即dp[i][j] = dp[i-1][j-1]。 - 若s1的第i个字符不等于s2的第j个字符,则可以进行插入、删除或替换操作,选择代价最小的操作。具体操作可分别表示为: - 插入操作:将s1的前i个字符转换成s2的前j-1个字符,再插入s2的第j个字符,此时编辑距离为dp[i][j-1] + 1。 - 删除操作:将s1的前i-1个字符转换成s2的前j个字符,再删除s1的第i个字符,此时编辑距离为dp[i-1][j] + 1。 - 替换操作:将s1的前i-1个字符转换成s2的前j-1个字符,再将s1的第i个字符替换成s2的第j个字符,此时编辑距离为dp[i-1][j-1] + 2(若替换前后两个字符相同,则代价为0)。 综上所述,状态转移方程为:dp[i][j] = min(dp[i-1][j-1] + cost, dp[i][j-1] + 1, dp[i-1][j] + 1),其中cost表示s1的第i个字符和s2的第j个字符是否相等。 4. 求解最优解:根据状态转移方程,利用动态规划自底向上地填充dp数组。最终,dp[m][n]即为将s1转换成s2所需要的最小编辑距离,其中m和n分别为s1和s2的长度。 通过动态规划求解编辑距离算法,可以高效地计算字符串间的相似度,并在自然语言处理、拼写检查、基因序列比对等领域得到广泛应用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值