编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
例如将kitten一字转成sitting:
sitten (k->s)
sittin (e->i)
sitting (->g)
所以kitten和sitting的编辑距离是3。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。
给出两个字符串a,b,求a和b的编辑距离。
Input
第1行:字符串a(a的长度 <= 1000)。 第2行:字符串b(b的长度 <= 1000)。
Output
输出a和b的编辑距离
Input示例
kitten sitting
Output示例
3
是一道动态规划的题,dp[i][j]表示第一个字符串的前i位和第二个字符串的前j位的最少编辑次数,则有递推式dp[i][j]=min(dp[i-1][j-1] + a[i]==a[j]?0:1,dp[i][j]).
#include <bits/stdc++.h>
using namespace std;
char a[1002],b[1002];
int dp[1002][1002];
int compare(char c,char d)
{
if(c==d)
return 0;
else
return 1;
}
int main()
{
cin>>a>>b;
int i,j,m,n;
m=strlen(a);
n=strlen(b);
for(i=0; i<=m; i++)
{
dp[i][0]=i;
}
for(i=0; i<=n; i++)
{
dp[0][i]=i;
}
for(i=1; i<=m; i++)
{
for(j=1; j<=n; j++)
{
dp[i][j]=min(dp[i-1][j],dp[i][j-1])+1;
dp[i][j]=min(dp[i][j],dp[i-1][j-1]+compare(a[i-1],b[j-1]));
}
}
cout<<dp[m][n]<<endl;
return 0;
}