最短编辑距离-动态规划

最短编辑距离

更新:2013-11-08

//


问题


 有两个字符串a和b。现在对这两个字符串的许可编辑方法有:一、将一个字

 符替换成另一个字符,二、添加一个字符、三、删除一个字符。
 如何用许可的编辑方法,经过最小次数(距离)地编辑a串,使a串变成b串?
 例如a="linszesze",b="lszlsz"。
 lnszesze(删除i),

 lszesze(删除i),

 lszlsze(替换e为l),

 lszlsz(删除e)。
 编辑距离为4。如果每种编辑方法都需要消耗一定的代价,那最短编辑距离问题
 就变成最小编辑代价问题。

分析


1定义运算规则
 设串a和串b分别表示为strA和strB。
 编辑方法:
 替换串a第i个字符记为:strSubstitute(strA,i),代价为costSubstitute。
 添加串a第i个字符记为:strInsert(strA,i),代价为costInsert。
 删除串a第i个字符记为:strDelete(strA,i),代价为costDelete。
 从a串到b串的编辑方法记为:
 公式a
edit(strA,strB) = str*(strA,i)+...+str*(strA,j);
  这里的+号不是数学的加,是编辑的步骤的累加。
 str*可为任意许可的编辑方法。
 从a串到b串的编辑代价记为:

 公式b

cost(edit(strA,strB)) = cost*+...+cost*; //cost*可为对应str*方法的代价
 因为用不同的编辑方法,cost(edit(strA,strB))就可能不同,所以,
 目标最小编辑代价:minCost(strA,strB) = minimun{costEdit(strA,strB)},
 其对应的编辑方法记为:minEdit(strA,strB)。


2分析运算规则
 对于两个长串,很难作出最小代价编辑方法判断。对串进行添加和删除后,
 串中的字符坐标就可能发生化。那么,有没有方法先将一个长串转换成更
 小的串,然后再利用这个小的串的解来对长串求解?
 为了适应从小串到长串的求解分析,串的表示方法也可以记为:
strA = strA(lowA,highA);
 lowA和highA分别为串的第一个字符的下标和最后一个字符的下标。
 strA串的第i个字符表示为:

strA[i];
 从a串转换到b串的最小编辑代价表示为:

minCost(strA(lowA,highA), strB(lowB,highB));


3尝试求解

 现在尝试对a串和b串的转换做一种规模划分。假设有
 strA(lowA,lowA)和strB(lowB,lowB)。
 a串转换成b串时,a串可以分割为两部分strA
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
动态规划是计算最短编辑距离的一种常用方。根据给定的字符,我们可以通过构建一个二维数组来表示最短编辑距离。假设字符str1的长度为m,字符str2的长度为n,我们可以定义一个大小为(m+1)×(n+1)的二维数组dp。 动态规划的推导过程如下: 1. 初始化dp数组,dp[i]表示将str1的前i个字符转换为空字符的最小编辑距离,dp[j]表示将空字符转换为str2的前j个字符的最小编辑距离。因此,dp[i] = i,dp[j] = j。 2. 遍历数组dp,计算dp[i][j]的值。 - 如果str1的第i个字符等于str2的第j个字符(即str1[i-1] == str2[j-1]),则dp[i][j] = dp[i-1][j-1],表示不需要进行编辑操作。 - 否则,dp[i][j]的值可以通过以下三种操作得到: - 如果将str1的前i-1个字符转换为str2的前j个字符的最小编辑距离为dp[i-1][j],则将str1的第i个字符删除,得到str1的前i-1个字符和str2的前j个字符的最小编辑距离为dp[i][j] = dp[i-1][j] + 1。 - 如果将str1的前i个字符转换为str2的前j-1个字符的最小编辑距离为dp[i][j-1],则将str2的第j个字符插入到str1的第i+1个位置,得到str1的前i个字符和str2的前j个字符的最小编辑距离为dp[i][j] = dp[i][j-1] + 1。 - 如果将str1的前i-1个字符转换为str2的前j-1个字符的最小编辑距离为dp[i-1][j-1],则将str1的第i个字符替换为str2的第j个字符,得到str1的前i个字符和str2的前j个字符的最小编辑距离为dp[i][j] = dp[i-1][j-1] + 1。 - 取上述三种操作中的最小值作为dp[i][j]的值。 3. 最终,最小编辑距离为dp[m][n]。 在本例中,示例输入为str1="ABC",str2="DCB",则根据动态规划的推导过程,可以计算得到最小编辑距离为3。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值