376,动态规划之编辑距离

想了解更多数据结构以及算法题,可以关注微信公众号“数据结构和算法”,每天一题为你精彩解答。也可以扫描下面的二维码关注
在这里插入图片描述

给你两个单词 word1 和 word2,请你计算出将 word1 转换成 word2 所使用的最少操作数 。


你可以对一个单词进行如下三种操作:


插入一个字符

删除一个字符

替换一个字符

示例 1:

输入:word1 = “horse”, word2 = “ros”

输出:3


解释

horse -> rorse (将 ‘h’ 替换为 ‘r’)

rorse -> rose (删除 ‘r’)

rose -> ros (删除 ‘e’)


总有共3步

示例 2:

输入:word1 = “intention”, word2 = “execution”

输出:5


解释:

intention -> inention (删除 ‘t’)

inention -> enention (将 ‘i’ 替换为 ‘e’)

enention -> exention (将 ‘n’ 替换为 ‘x’)

exention -> exection (将 ‘n’ 替换为 ‘c’)

exection -> execution (插入 ‘u’)


总有共5步


问题分析:

1,如果想把word1变为word2,对于word1的操作我们有3种方式:

  • 删除一个字符
  • 添加一个字符
  • 修改一个字符

这就好比对数据库的增删改查一样,不过这里没有查找。

我们用dp[i][j]表示把word1的前i个字符变为word2的前j个字符所需要的最少编辑距离,这里要分两种情况


1,当word1[i]==word2[j]:也就是说word1的第i个字符和word2的第j个字符相等,我们不需要修改word1的第i个字符,所以这时dp[i][j]=dp[i-1][j-1]

2,当word1[i]!=word2[j]:也就是说word1的第i个字符和word2的第j个字符不相等。这时我们可以有3种操作来计算dp[i][j];

  • ,dp[i-1][j]:表示的是word1的前i-1个字符和word2的前j个字符的最小编辑距离,在dp[i][j]中我们只需要把word1中第i个字符删除就是dp[i-1][j],所以dp[i][j]=dp[i-1][j]+1。
  • ,dp[i][j-1]:表示的是word1的前i个字符和word2的前j-1个字符的最小编辑距离,在dp[i][j]中我们只需要把word2中的第j个字符删除就是dp[i][j-1],所以dp[i][j]=dp[i][j-1]+1。(注:我们这一步明明是增,但这里为什么是删,因为我们这里删的是word2的字符,增和删是相对的,word2字符的删除也可以认为是word1字符的添加,举个例子,比如word1=“a”,word2=“ab”,我们在word1中添加一个b或者在word2中删除一个b,最短编辑距离都是一样的)
  • ,dp[i-1][j-1]:表示的是word1的前i-1个字符和word2的前j-1个字符的最小编辑距离,我们只需要把word1的第i个字符修改为word2的第j个字符就可以求出dp[i][j],所以dp[i][j]=dp[i-1][j-1]+1。

上面三种情况我们要选最小的,所以递推公式

1,当word1[i]==word2[j]:

dp[i][j]=dp[i-1][j-1]


2,当word1[i]!=word2[j]:

dp[i][j]=min{dp[i-1][j-1],dp[i-1][j],dp[i][j-1]}+1


边界条件:

如果word1为空,我们要把word1变为word2就是不停的插入,

如果word2为空,我们要把word1变为word2就是不停的删除。


下面我们来画个图看一下
在这里插入图片描述

举个例子,

比如(0,0)格内,我们只需要把h变为r即可,所以需要1步。

比如(0,1)格内,我们只需要把h变为r,然后删除O,所以需要2步。

比如(1,0)格内,我们只需要把h变为r,然后在添加一个O,所以需要2步。

比如(1,1)格内,因为O==O,我们只需要把h变为r即可,所以需要1步。


看懂了上面的分析过程,代码就容易多了,我们来看下代码


01
代码部分

public static int minDistance(String word1, String word2) {
    int length1 = word1.length();
    int length2 = word2.length();
    if (length1 * length2 == 0)
        return length1 + length2;//如果有一个为空,直接返回另一个的长度即可
    int dp[][] = new int[length1 + 1][length2 + 1];
    for (int i = 0; i <= length1; i++) {
        dp[i][0] = i;//边界条件,相当于word1的删除操作
    }
    for (int i = 0; i <= length2; i++) {
        dp[0][i] = i;//边界条件,相当于word1的添加操作
    }
    for (int i = 1; i <= word1.length(); i++) {
        for (int j = 1; j <= length2; j++) {//下面是上面分析的递推公式
            if (word1.charAt(i - 1) == word2.charAt(j - 1)) {//判断两个字符是否相等
                dp[i][j] = dp[i - 1][j - 1];
            } else {
                dp[i][j] = Math.min(Math.min(dp[i - 1][j], dp[i][j - 1]), dp[i - 1][j - 1]) + 1;
            }
        }
    }
    Util.printTwoIntArrays(dp);//测试数据的打印,可去掉
    return dp[length1][length2];
}

代码比较简单,核心代码也就15到19行,其他的也就是一些边界的判断。

我们还用上面的数据测试一下,看一下打印结果

1public static void main(String args[]) {
2    System.out.println(minDistance("horse", "ros"));
3}

结果如下
在这里插入图片描述

和我们上面分析的完全一致。


02
代码优化

我们看到虽然dp是二维数组,但我们计算的时候每个元素只和他的左边,上边,左上角的3个值有关,所以这里我们还可以优化一下,使用一维数组,我们看下代码

public static int minDistance2(String word1, String word2) {
    int length1 = word1.length();
    int length2 = word2.length();
    if (length1 * length2 == 0)
        return length1 + length2;
    int dp[] = new int[length2 + 1];
    for (int i = 1; i <= length2; i++) {
        dp[i] = i;
    }
    int last = 0;
    for (int i = 1; i <= word1.length(); i++) {
        last = dp[0];
        dp[0] = i;
        for (int j = 1; j <= length2; j++) {
            int temp = dp[j];
            if (word1.charAt(i - 1) == word2.charAt(j - 1)) {
                dp[j] = last;
            } else {
                dp[j] = Math.min(Math.min(dp[j - 1], dp[j]), last) + 1;
            }
            last = temp;
        }
        Util.printIntArrays(dp);//这两行代码仅做测试打印数据使用,可删除
        System.out.println();
    }
    return dp[length2];
}

代码中last记录的是左上角的值,因为这个值会被覆盖,所以我们提前记录了下来,我们还用上面的代码测试一下,再来看一下打印结果

在这里插入图片描述

结果和我们上面分析的完全一致。

总结:

这道题相对来说还是有一定的难度的,首先要了解什么是动态规划,然后再找出他的递推公式,还有一些边界条件的判断,最后是代码的优化。


在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

数据结构和算法

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值