题目描述:
编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
例如将kitten一字转成sitting:
sitten (k->s)
sittin (e->i)
sitting (->g)
所以kitten和sitting的编辑距离是3。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。
给出两个字符串a,b,求a和b的编辑距离。
例如: a= “ABCF” b = “DBFG”
那么我们可以
(1) 把D改为A
(2) 删掉G
(3) 加入C
所以答案是3。
输入输出:
输入:
第1行:字符串a(a的长度 <= 1000)。
第2行:字符串b(b的长度 <= 1000)。
输出:
输出a和b的编辑距离。
输入样例:
kitten
sitting
输出样例:
3
题目分析:
运用动态规划思想,dp[i][j]表示a字符串的第i位与b字符串的第j位的编辑距离,思考可以发现这个状态取决于编辑距离的三种情况:
插入:dp[i][j]=dp[i][j-1]+1;
删除:dp[i][j]=dp[i-1][j]+1;
变更:dp[i][j]=dp[i-1][j-1]+same(a[i],b[j]); (若a[i]与b[j]相同,same返回0,不同则为1)。
代码如下:
#include <iostream>
#include <stdio.h>
#include <string.h>
using namespace std;
char s1[1010],s2[1010];
int dp[1010][1010];
int main()
{
while(~scanf("%s %s",s1,s2))
{
int len1=strlen(s1),len2=strlen(s2);
memset(dp,0,sizeof(dp));
for(int i=0;i<=len1;i++) dp[i][0]=i;
for(int j=0;j<=len2;j++) dp[0][j]=j;
for(int i=1;i<=len1;i++)
{
for(int j=1;j<=len2;j++)
{
dp[i][j]=min(dp[i-1][j] , dp[i][j-1]) + 1;
dp[i][j]=min(dp[i][j] , dp[i-1][j-1] + (s1[i-1] != s2[j-1]));
}
}
printf("%d\n",dp[len1][len2]);
}
return 0;
}