编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
例如将kitten一字转成sitting:
sitten (k->s)
sittin (e->i)
sitting (->g)
所以kitten和sitting的编辑距离是3。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。
给出两个字符串a,b,求a和b的编辑距离。
Input第1行:字符串a(a的长度 <= 1000)。
第2行:字符串b(b的长度 <= 1000)。
Output输出a和b的编辑距离
Sample Input
kitten sittingSample Output
3
思路:变形最长公共子序列.
设dp[i][j]表示s前i个字符和t前j个字符的编辑距离。基础dp,注意边界dp[i][0]和dp[0][i]。
#include<cstring>
#include<iostream>
using namespace std;
char a[1005],b[1005];
int dp[1005][1005];
int main()
{
int i,j,k,s;
while(~scanf("%s%s",a,b))
{
k=strlen(a);
s=strlen(b);
for(i=0;i<=k;i++)
dp[0][i]=i;
for(i=0;i<=s;i++)
dp[i][0]=i;
for(i=1;i<=k;i++)
for(j=1;j<=s;j++)
{
if(a[i-1]==b[j-1])
dp[i][j]=dp[i-1][j-1];
else
{
dp[i][j]=min(dp[i-1][j-1],min(dp[i-1][j],dp[i][j-1]))+1;
}
}
printf("%d\n",dp[k][s]);
}
return 0;
}