编辑距离
编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
例如将kitten一字转成sitting:
sitten (k->s)
sittin (e->i)
sitting (->g)
所以kitten和sitting的编辑距离是3。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。
给出两个字符串a,b,求a和b的编辑距离。
kitten sitting
3
【分析】dp[i]j[j] 代表 1~i位的字符串1转变为1~j位的字符串2所需的最少次数
#include <iostream>
#include <cstdio>
#include <cstring>
using namespace std;
#define cl(a,b) memset(a,b,sizeof a);
const int maxn = 1e3 + 10;
char a[maxn],b[maxn];
int dp[maxn][maxn];
int main()
{
while(~scanf("%s%s",&a,&b)){
int lena = strlen(a),lenb = strlen(b);
cl(dp,0);
for(int i=0;i<=lena;i++){
dp[i][0] = i;
}
for(int i=0;i<=lenb;i++){
dp[0][i] = i;
}
for(int i=1;i<=lena;i++){
for(int j=1;j<=lenb;j++){
if(a[i-1] == b[j-1]){
dp[i][j] = dp[i-1][j-1];
}
else{
dp[i][j] = min(dp[i-1][j]+1,dp[i][j-1]+1);
dp[i][j] = min(dp[i][j],dp[i-1][j-1]+1);
}
}
}
printf("%d\n",dp[lena][lenb]);
}
return 0;
}