编辑距离
【问题描述】
设A和B是两个字符串。我们要用最少的字符操作次数,将字符串A转换为字符串B。这里所说的字符操作共有三种:
1、删除一个字符;
2、插入一个字符;
3、将一个字符改为另一个字符。
【编程任务】
对任的两个字符串A和B,计算出将字符串A变换为字符串B所用的最少字符操作次数。
【输入格式】edit.in
第一行为字符串A;第二行为字符串B;字符串A和B的长度均小于200。
【输出格式】edit.out
只有一个正整数,为最少字符操作次数。
【输入样例】
sfdqxbw
gfdgw
【输出样例】
4
【算法分析】
有点类似最长公共子序列的意思,编程的目标是将 a串 往 b串 变
状态:f[i][j]记录ai与bj的最优编辑距离
结果:f[m][n],其中m、n分别是a、b的串长
初值:b串空,要删a串长个字符;a串空,要插b串长个字符
转移方程:当a[i]=b[j]时,f[i][j]=f[i-1][j-1],否则,
f[i][j]=min(f[i-1][j-1]+1,f[i][j-1]+1,f[i-1][j]+1)
说明:
1、f[i-1][j-1]+1:改a[i]为b[j];因为这里我们是拿字母 a[i] 与 b这个串进行挨个比较 比较过后就不管 a[i] 了,所以可以理解改变 a[i] -> b[j] ,而不是 b[j] -> a[i]。
2、f[i][j-1]+1:a[i]后插入b[j-1];
3、f[i-1][j]+1:删a[i]。//就是a[i] 前一个字母 在这个位置的操作数 + 1(这个 1 就是删除a[i]这个字母的操作)
【源代码】
#include<bits/stdc++.h>
using namespace std;
char a[2005],b[2005];
int f[2005][2005]; //a[i] 与 b[j]的最优编辑距离
int main()
{
int m,n,i,j,k;
cin >> a >> b;//注意下标从0开始
m=strlen(a);
n=strlen(b);
//初始化 a 或 b 的字符长度为 0 时的操作数
f[0][0]=0;
for(j=1;j<=n;j++) f[0][j]=j;//当a 长度为 0 时
for(i=1;i<=m;i++) f[i][0]=i;//当b 长度为 0 时
for(i=1;i<=m;i++)//a
{
for(j=1;j<=n;j++)//b
{//两个字符相等 则不执行任何操作(注意字符下标从0开始 要-1)
if(a[i-1] == b[j-1]) f[i][j]=f[i-1][j-1];
else//两者不相等 有三种操作
{
//1、改变这个字符 使其相等
f[i][j]=f[i-1][j-1]+1;
//2、删除a[i]这个字符
f[i][j]=min(f[i][j],f[i-1][j]+1);
//3、在a[i]后插入b[j-1]
f[i][j]=min(f[i][j],f[i][j-1]+1);
}
}
}
cout << f[m][n];
return 0;
}