LeetCode - 解题笔记 - 72 - Edit Distance

Solution 1

这道题之前上的自然语言处理课上讲过,所以印象比较深。而且我们当时上课的更加复杂,还包括一种相邻两个位置交换的情形。

实际上这道题就是一个动态规划,我们把子问题简化到只考虑当前两个字符串的考察字符之间的调整,那么就有两个情况:

  1. 二者相同,那么当前考察位置上不做调整。
  2. 二者不同,执行(第二个字符串相对于第一个字符串的)增加、删除、替换操作。

那么最优子结构 ans ⁡ [ i ] [ j ] \operatorname{ans}[i][j] ans[i][j] 定义为:第一个字符串的前 i i i 个字符于第二个字符串的前 j j j 个字符进行比较的最小编辑距离。对应上述两种情况:

  1. 如果 word1 ⁡ [ i ] = = word2 ⁡ [ j ] \operatorname{word1}[i] == \operatorname{word2}[j] word1[i]==word2[j],那么当前考察位置不会引入额外的编辑操作,即 ans ⁡ [ i ] [ j ] = ans ⁡ [ i − 1 ] [ j − 1 ] \operatorname{ans}[i][j] = \operatorname{ans}[i - 1][j - 1] ans[i][j]=ans[i1][j1]
  2. 否则,需要考虑(第二个字符串相对于第一个字符串的)的增加、删除、替换操作引入的编辑距离,三者分别对应 ans ⁡ [ i ] [ j − 1 ] \operatorname{ans}[i][j - 1] ans[i][j1] (考察到当前位置,相对于前一个状态多了一个第二个字符串的增加操作)、 ans ⁡ [ i − 1 ] [ j ] \operatorname{ans}[i - 1][j] ans[i1][j] (考察到当前位置,相对于前一个状态多了一个第一个字符串的删除操作)以及 ans ⁡ [ i − 1 ] [ j − 1 ] \operatorname{ans}[i - 1][j - 1] ans[i1][j1] (替换以保证二者相同),即 ans ⁡ [ i ] [ j ] = min ⁡ { ans ⁡ [ i ] [ j − 1 ] + 1 , ans ⁡ [ i − 1 ] [ j ] + 1 , ans ⁡ [ i − 1 ] [ j − 1 ] + 1 } \operatorname{ans}[i][j] = \min \{ \operatorname{ans}[i][j - 1] + 1, \operatorname{ans}[i - 1][j] + 1, \operatorname{ans}[i - 1][j - 1] + 1\} ans[i][j]=min{ans[i][j1]+1,ans[i1][j]+1,ans[i1][j1]+1}

初始化边界条件,就是其中一个是空串的情形,那编辑距离就是另外一个非空字符串的长度(一直加到相同)。

  • 时间复杂度: O ( m n ) O(mn) O(mn),其中 m m m n n n分别为两个输入字符串的长度,二维遍历
  • 空间复杂度: O ( m n ) O(mn) O(mn),其中 m m m n n n分别为两个输入字符串的长度,需要记录整个遍历过程中的所有结果(实际上不用……)
class Solution {
public:
    int minDistance(string word1, string word2) {
        int len1 = word1.size();
        int len2 = word2.size();
        vector<vector<int>> ans(len1 + 1, vector<int>(len2 + 1, 0)); // DP数组尺寸 len1+1 * len2+1

        // 初始化,任意长字串到空串的编辑距离为非空长度
        for (int i = 0; i <= len1; i++) {
            ans[i][0] = i;
        }
        for (int i = 0; i <= len2; i++) {
            ans[0][i] = i;
        }

        for (int i = 1; i <= len1; i++) {
            for (int j = 1; j <= len2; j++) {
                if (word1[i - 1] == word2[j - 1]){
                    ans[i][j] = ans[i - 1][j - 1];
                } else {
                    // 增加、删除、修改
                    ans[i][j] = min(ans[i][j - 1], min(ans[i - 1][j], ans[i - 1][j - 1])) + 1;
                }
            }
        }
        return ans[len1][len2];
    }
};

Solution 2

Solution 1的Python实现

class Solution:
    def minDistance(self, word1: str, word2: str) -> int:
        ans = [[0] * (len(word2) + 1) for i in range(len(word1) + 1)]
        
        for i in range(len(word1) + 1): ans[i][0] = i
        for i in range(len(word2) + 1): ans[0][i] = i
            
        for i in range(1, len(word1) + 1):
            for j in range(1, len(word2) + 1):
                if word1[i - 1] == word2[j - 1]: ans[i][j] = ans[i - 1][j - 1]
                else: ans[i][j] = min(ans[i][j - 1], ans[i - 1][j], ans[i - 1][j - 1]) + 1
                    
        return ans[len(word1)][len(word2)]
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
LeetCode-Editor是一种在线编码工具,它提供了一个用户友好的界面编写和运行代码。在使用LeetCode-Editor时,有时候会出现乱码的问题。 乱码的原因可能是由于编码格式不兼容或者编码错误导致的。在这种情况下,我们可以尝试以下几种解决方法: 1. 检查文件编码格式:首先,我们可以检查所编辑的文件的编码格式。通常来说,常用的编码格式有UTF-8和ASCII等。我们可以将编码格式更改为正确的格式。在LeetCode-Editor中,可以通过界面设置或编辑器设置来更改编码格式。 2. 使用正确的字符集:如果乱码是由于使用了不同的字符集导致的,我们可以尝试更改使用正确的字符集。常见的字符集如Unicode或者UTF-8等。在LeetCode-Editor中,可以在编辑器中选择正确的字符集。 3. 使用合适的编辑器:有时候,乱码问题可能与LeetCode-Editor自身相关。我们可以尝试使用其他编码工具,如Text Editor、Sublime Text或者IDE,看是否能够解决乱码问题。 4. 查找特殊字符:如果乱码问题只出现在某些特殊字符上,我们可以尝试找到并替换这些字符。通过仔细检查代码,我们可以找到导致乱码的特定字符,并进行修正或替换。 总之,解决LeetCode-Editor乱码问题的方法有很多。根据具体情况,我们可以尝试更改文件编码格式、使用正确的字符集、更换编辑器或者查找并替换特殊字符等方法来解决这个问题。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值