leetcode — 72. 编辑距离

给你两个单词 word1 和 word2,请你计算出将 word1 转换成 word2 所使用的最少操作数 。

你可以对一个单词进行如下三种操作:

  • 插入一个字符
  • 删除一个字符
  • 替换一个字符

示例 1:

输入:word1 = "horse", word2 = "ros"
输出:3
解释:
horse -> rorse (将 'h' 替换为 'r')
rorse -> rose (删除 'r')
rose -> ros (删除 'e')

示例 2:

输入:word1 = "intention", word2 = "execution"
输出:5
解释:
intention -> inention (删除 't')
inention -> enention (将 'i' 替换为 'e')
enention -> exention (将 'n' 替换为 'x')
exention -> exection (将 'n' 替换为 'c')
exection -> execution (插入 'u')

提示:

  • 0 <= word1.length, word2.length <= 500
  • word1 和 word2 由小写英文字母组成

 编辑距离算法是用作机器翻译和语音识别评价标准的基本算法。

1、暴力枚举检查所有可能的编辑方法,取最短的一个。—— 所有可能的编辑方法达到指数级,并不需要进行这么多计算,只需要找到距离最短的序列而不是所有可能的序列。

2、动态规划

  • 定义 dp[i][j]
    • dp[i][j] 代表 word1 中前 i 个字符,变换到 word2 中前 j 个字符,最短需要操作的次数;
    • 需要考虑 word1 或 word2 一个字母都没有,即全增加/删除的情况,预初始化 dp[0][j] 和 dp[i][0]
  • 状态转移
    • 增加,dp[i][j] = dp[i][j - 1] + 1
    • 删除,dp[i][j] = dp[i - 1][j] + 1
    • 替换,dp[i][j] = dp[i - 1][j - 1] + 1
    • 按顺序计算,当计算 dp[i][j] 时,dp[i - 1][j] , dp[i][j - 1] , dp[i - 1][j - 1] 均已经确定了
    • 配合增删改这三种操作,需要对应的 dp 把操作次数加一,取三种操作的最小结果
    • 如果刚好这两个字母相同 word1[i-1] = word2[j-1] (元素下标超前一位),那么可以直接参考 dp[i - 1][j - 1] ,操作不用加一。
    • 对于边界情况,一个空串和一个非空串的编辑距离为 dp[i][0] = i 和 dp[0][j] = j,dp[i][0] 相当于对 word1 执行 i 次删除操作,dp[0][j] 相当于对 word1执行 j 次插入操作(相当于对word2执行 j 次删除操作)。

  • 复杂度分析
    • 时间复杂度 :O(mn),其中 m 为 word1 的长度,n 为 word2 的长度。
    • 空间复杂度 :O(mn),我们需要大小为 O(mn) 的 dp 数组来记录状态值。

1、如果 word1[0..i-1] 到 word2[0..j-1] 的变换需要消耗 k 步,那 word1[0..i] 到 word2[0..j] 的变换需要几步?

        先使用 k 步,把 word1[0..i-1] 变换到 word2[0..j-1],消耗 k 步。再把 word1[i] 改成 word2[j],就行了。如果 word1[i] == word2[j],什么也不用做,一共消耗 k 步;否则需要替换,共消耗 k + 1 步。

2、如果 word1[0..i-1] 到 word2[0..j] 的变换需要消耗 k 步,那 word1[0..i] 到 word2[0..j] 的变换需要消耗几步?

        先经过 k 步,把 word1[0..i-1] 变换到 word2[0..j],消耗掉 k 步,再把 word1[i] 删除,这样,word1[0..i] 就完全变成了 word2[0..j] ,共 k + 1 步。

3、如果 word1[0..i] 到 word2[0..j-1] 的变换需要消耗 k 步,那 word1[0..i] 到 word2[0..j] 的变换需要消耗几步?

        先经过 k 步,把 word1[0..i] 变换成 word2[0..j-1],消耗掉 k 步,接下来,再插入一个字符 word2[j], word1[0..i] 就完全变成了 word2[0..j] 了。

总结:word1[0..i] 变换成 word2[0..j] 主要有三种方式,选择消耗最小的一种方式。


class Solution {
    public int minDistance(String word1, String word2) {
        int len_word1 = word1.length();
        int len_word2 = word2.length();

        // 建立动态规划的数组,预留为空字符串匹配时的结果
        int[][] dp = new int [len_word1+1][len_word2+1];

        for(int i = 0; i < dp.length; i ++){
            dp[i][0] = i;
        }
        for(int j = 0; j < dp[0].length; j ++){
            dp[0][j] = j;
        }

        for(int i = 1; i < dp.length; i ++){
            for(int j = 1; j < dp[0].length; j ++){
                // 此处注意下标,在建立dp数组时超前了一位
                if(word1.charAt(i-1) == word2.charAt(j-1)){
                    dp[i][j] = dp[i-1][j-1];
                }else{
                    dp[i][j] = Math.min(Math.min(dp[i-1][j], dp[i][j-1]), dp[i-1][j-1]) + 1;
                }
            }
        }

        return dp[len_word1][len_word2];
    }
}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值