最短编辑距离-动态规划

本文介绍了最短编辑距离问题,包括字符串的删除、插入和替换三种编辑操作,并通过动态规划的方法来解决这一问题。文章提供了算法分析和伪代码,探讨如何从一个字符串转换到另一个字符串的最小编辑代价。
摘要由CSDN通过智能技术生成
最短编辑距离

更新:2013-11-08

//


问题


 有两个字符串a和b。现在对这两个字符串的许可编辑方法有:一、将一个字

 符替换成另一个字符,二、添加一个字符、三、删除一个字符。
 如何用许可的编辑方法,经过最小次数(距离)地编辑a串,使a串变成b串?
 例如a="linszesze",b="lszlsz"。
 lnszesze(删除i),

 lszesze(删除i),

 lszlsze(替换e为l),

 lszlsz(删除e)。
 编辑距离为4。如果每种编辑方法都需要消耗一定的代价,那最短编辑距离问题
 就变成最小编辑代价问题。

分析


1定义运算规则
 设串a和串b分别表示为strA和strB。
 编辑方法:
 替换串a第i个字符记为:strSubstitute(strA,i),代价为costSubstitute。
 添加串a第i个字符记为:strInsert(strA,i),代价为costInsert。
 删除串a第i个字符记为:strDelete(strA,i),代价为costDelete。
 从a串到b串的编辑方法记为:
 公式a
edit(strA,strB) = str*(strA,i)+...+str*(strA,j);
  这里的+号不是数学的加,是编辑的步骤的累加。
 str*可为任意许可的编辑方法。
 从a串到b串的编辑代价记为:

 公式b

cost(edit(strA,strB)) = cost*+...+cost*; //cost*可为对应str*方法的代价
 因为用不同的编辑方法,cost(edit(strA,strB))就可能不同,所以,
 目标最小编辑代价:minCost(strA,strB) = minimun{costEdit(strA,strB)},
 其对应的编辑方法记为:minEdit(strA,strB)。


2分析运算规则
 对于两个长串,很难作出最小代价编辑方法判断。对串进行添加和删除后,
 串中的字符坐标就可能发生化。那么,有没有方法先将一个长串转换成更
 小的串,然后再利用这个小的串的解来对长串求解?
 为了适应从小串到长串的求解分析,串的表示方法也可以记为:
strA = strA(lowA,highA);
 lowA和highA分别为串的第一个字符的下标和最后一个字符的下标。
 strA串的第i个字符表示为:

strA[i];
 从a串转换到b串的最小编辑代价表示为:

minCost(strA(lowA,highA), strB(lowB,highB));


3尝试求解

 现在尝试对a串和b串的转换做一种规模划分。假设有
 strA(lowA,lowA)和strB(lowB,lowB)。
 a串转换成b串时,a串可以分割为两部分strA
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值