题目描述
设A和B是两个字符串。我们要用最少的字符操作次数,将字符串A转换为字符串B。这里所说的字符操作共有三种:
1. 删除一个字符;
2. 插入一个字符;
3. 将一个字符改为另一个字符。
对任给的两个字符串A和B,计算出将字符串A变换为字符串B所用的最少字符操作次数。
输入格式:第一行为字符串A;第二行为字符串B;字符串A和B的长度均小于200。
输出格式:只有一个正整数,为最少字符操作次数。
样例输入:sfdxbqw gfdgw
样例输出:4
编辑距离指的是将字符串A变成字符串B的最短距离,通过删除,插入和替换三种操作实现。
先从两个简单的字符串说起,例如字符串a:"abc",字符串b:"adc"之间的编辑距离是多少?我们可以从最后一个字母开始,字符串a,b最后一个字符都是c,是相等的,可以不做任何操作,此时字符串a和b的编辑距离就等价于“ab”和“ad”之间的距离,即d(abc,adc)=d(ab,ad)。也就是说,如果在比较的过程中有相同的字符,那么二者之间的距离就是剩余部分的距离,即d(i,j)=d(i-1,j-1)。
我们还是从两个字符串的最后一个字符来考察即’b’和’c’。显然二者不相同,那么我们有以下三种处理办法:
(1)增加:在A末尾增加一个’c’,那么A变成了"xyzabc",B仍然是"axyzc",由于此时末尾字符相同了,那么就变成了比较"xyzab"和"axyz"的距离,即d(xyzab,axyzc) = d(xyzab,axyz) + 1。可以写成d(i,j) = d(i,j - 1) + 1。表示下次比较的字符串B的长度减少了1,而加1表示当前进行了一次字符的操作。
(2)删除:删除A末尾的字符’b’,考察A剩下的部分与B的距离。即d(xyzab,axyzc) = d(xyza,axyzc) + 1。可以写成d(i,j) = d(i - 1,j) + 1。表示下次比较的字符串A的长度减少了1。
(3)替换:把A末尾的字符替换成’c’,这样就与B的末尾字符一样了,那么接下来就要考察出了末尾’c’部分的字符,即d(xyzab,axyzc) = d(xyza,axyz) + 1。写成d(i,j) = d(i -1,j-1) + 1表示字符串A和B的长度均减少了1。
由于我们要求的是最短的编辑距离,所以我们取以上三个步骤得出的距离的最小值为最短编辑距离。由上面的步骤可得,这是一个递归的过程,因为除掉最后一个字符之后,剩下的字符串的最后一位仍然是最后一个字符,我们仍然可以按照上面的三种操作来进行,经过这样的不断递归,直到比较到第一个字符为止,递归结束。
由于递归的计算过程中有大量的重复运算,在此我们用d[i][j]表示每一步的运算结果。
#include<iostream>
#include<cstring>
#include<algorithm>
using namespace std;
int dp[200][200];//A的前i个字符A[0...i-1]和B的前j个字符B[0...j-1]的最小操作次数
string A,B;
int main()
{
cin>>A>>B;
int n=A.length();
int m=B.length();
for(int i=0;i<=n;i++){
for(int j=0;j<=m;j++){
//空串A和串B,加加加加加...
if(i==0){
dp[i][j]=j;
continue;
}
//串A和空串B,减减减减减...
if(j==0){
dp[i][j]=i;
continue;
}
// 删除 //增加
dp[i][j]=min(dp[i-1][j]+1,dp[i][j-1]+1);
//替换
dp[i][j]=min(dp[i][j],dp[i-1][j-1]+1);
if(A[i-1]==B[j-1])//相等
dp[i][j]=min(dp[i][j],dp[i-1][j-1]);
}
}
cout<<dp[n][m]<<endl;
return 0;
}