编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
例如将kitten一字转成sitting:
sitten (k->s)
sittin (e->i)
sitting (->g)
所以kitten和sitting的编辑距离是3。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。
给出两个字符串a,b,求a和b的编辑距离。
Input
第1行:字符串a(a的长度 <= 1000)。 第2行:字符串b(b的长度 <= 1000)。
Output
输出a和b的编辑距离
Input示例
kitten sitting
Output示例
3
思路:设dp[i][j]为字符串a的前i个字符和字符串b的前j个字符的编辑距离。那么我们来看看dp[i][j]可以由哪些状态转移而来。
如果a[i-1]=b[i-1],那么显然dp[i][j]=dp[i-1][j-1]
如果不等呢?那么它可以由dp[i-1][j-1],dp[i-1][j],dp[i][j-1]转移而来,分别是替换,添加,删除操作。这样就能得到递推式了。
代码:
#include <cmath>
#include <cstring>
#include <cstdio>
#include <vector>
#include <string>
#include <algorithm>
#include <string>
#include <set>
#include <cmath>
#define MAXN 1010
using namespace std;
char a[MAXN],b[MAXN];
int dp[MAXN][MAXN];//dp[i][j]a的前i个字符和b的前j个字符的编辑距离
int main()
{
scanf("%s%s",a,b);
int la=(int)strlen(a);
int lb=(int)strlen(b);
for(int i=0;i<=la;i++)
dp[i][0]=i;
for(int i=0;i<=lb;i++)
dp[0][i]=i;
for(int i=1;i<=la;i++)
for(int j=1;j<=lb;j++)
{
if(a[i-1]==b[j-1]){
dp[i][j]=dp[i-1][j-1];
}else{
dp[i][j]=min(min(dp[i-1][j],dp[i][j-1]),dp[i-1][j-1])+1;
}
}
printf("%d\n",dp[la][lb]);
return 0;
}