编辑距离问题(动态规划)

问题描述:

设A和B是两个字符串,要用最少的字符操作将字符串A转换为字符串B,这里所说的字符操作包括(1):删除一个字符;(2):插入一个字符;(3):修改一个字符。将A转换为B所用的最少字符操作数称为A到B的编辑距离,记为dp[A][B],dp[][]中的A,B指的是A和B的长度,设计一个算法对任给的A,B,计算出dp[A][B]。

样例:

输入: 字符串A = “horse”, 字符串B = “ros”
输出: 3
解释:
horse -> rorse (将 ‘h’ 替换为 ‘r’)
rorse -> rose (删除 ‘r’)
rose -> ros (删除 ‘e’)


问题分析:

首先回忆一下动态规划算法的基本要素

  • 最优子结构性质
  • 子问题重叠性质

而此题刚好符合动态规划算法的条件。试想一下,在最后一步计算出dp[i][j]的时候,你是通过什么途径呢?肯定是删除插入修改其中的一个动作。删除插入都是在dp[i][j-1]或者dp[i-1][j]的基础上进行一步动作,所以通过删除插入得到的dp[i][j] = min(dp[i-1][j]),dp[i][j-1])+1。 通过修改得到的dp[i][j]肯定是在dp[i-1][j-1]的基础上,得到了两个不一样的字符(即A(i)!=B(j)),如果得到的字符相等(即A(i)==B(j)) 则 dp[i][j] = dp[i-1=[j-1]。 求三种情况下最小的值就可以求出dp[i][j]了

递推表达式:


                   i  			(j==0)
                   j     		(i==0)
 dp[i][j] =    min(dp[i-1][j]+1,dp[i][j-1]+1,dp[i-1][j-1])  (0<i<A.length,0<j<B.length, A[i]==B[i])
               min(dp[i-1][j]+1,dp[i][j-1]+1,dp[i-1][j-1+!])  (0<i<A.length,0<j<B.length, A[i]!=B[i])

代码 :

注意数组下标从零开始的特点,当心数组越界。

package DP;
/*
编辑距离问题   插入 删除 修改三种操作
 */
public class L72 {
   static int calsulate(String str1,String str2){

        int dp[][] = new int [str1.length()+1][str2.length()+1];

        for(int i=0;i<=str1.length();i++)
            dp[i][0]=i;
        for(int i=0;i<=str2.length();i++)
            dp[0][i]=i;

        for(int i=1;i<=str1.length();i++){
            for(int j=1;j<=str2.length();j++){
                if(str1.charAt(i-1)==str2.charAt(j-1))
                    dp[i][j] = dp[i-1][j-1];
                else
                    dp[i][j] = dp[i-1][j-1]+1;
               dp[i][j] =min(dp[i][j],dp[i-1][j]+1,dp[i][j-1]+1);
            }//end inner for

        }//end outer for
        return dp[str1.length()][str2.length()];
    }

   static int min(int a,int b,int c){
        int d;
        if(a<b)
            d=a;
        else
            d=b;
        if(d<c)
            return d;
        else
            return c;
    }

    public static void main(String[] args) {

            String s1 = "horse";
            String s2 = "ros";
            System.out.print(calsulate(s1,s2));



    }
}

编辑距离问题是一个经典的动态规划问题,用于衡量两个字符串之间的相似度。它可以通过一系列的插入、删除和替换操作将一个字符串转换为另一个字符串动态规划是解决编辑距离问题的常用方。 下面是使用动态规划解决编辑距离问题的步骤: 1. 创建一个二维数组dp,其中dp[i][j]表示将字符串A的前i个字符转换为字符串B的前j个字符所需的最小操作数。 2. 初始化dp数组的第一行和第一列,分别表示将空字符串转换为A和B所需的操作数。 3. 遍历dp数组,计算dp[i][j]的值: - 如果A的第i个字符等于B的第j个字符,则dp[i][j]等于dp[i-1][j-1],因为不需要进行任何操作。 - 否则,dp[i][j]等于dp[i-1][j-1] + 1,表示将A的第i个字符替换为B的第j个字符。 - 另外,还需要考虑插入和删除操作。dp[i][j]等于dp[i][j-1] + 1,表示在A的第i个字符后插入B的第j个字符;dp[i][j]等于dp[i-1][j] + 1,表示删除A的第i个字符。 - 最后,取这三种操作中的最小值作为dp[i][j]的值。 4. 最终,dp[m][n]即为将字符串A转换为字符串B所需的最小操作数,其中m和n分别为A和B的长度。 下面是一个使用动态规划求解编辑距离的Python代码示例: ```python def minDistance(word1, word2): m, n = len(word1), len(word2) dp = [[0] * (n + 1) for _ in range(m + 1)] for i in range(m + 1): dp[i][0] = i for j in range(n + 1): dp[0][j] = j for i in range(1, m + 1): for j in range(1, n + 1): if word1[i - 1] == word2[j - 1]: dp[i][j] = dp[i - 1][j - 1] else: dp[i][j] = min(dp[i - 1][j - 1], dp[i][j - 1], dp[i - 1][j]) + 1 return dp[m][n] word1 = "horse" word2 = "ros" print("编辑距离为:", minDistance(word1, word2)) # 输出:3 ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值