编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
例如将kitten一字转成sitting:
sitten (k->s)
sittin (e->i)
sitting (->g)
所以kitten和sitting的编辑距离是3。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。
给出两个字符串a,b,求a和b的编辑距离。
Input
第1行:字符串a(a的长度 <= 1000)。 第2行:字符串b(b的长度 <= 1000)。
Output
输出a和b的编辑距离
Input示例
kitten sitting
Output示例
3
设dp[i][j]代表a字符串前i个变形b字符串前j个最小操作步数;
例题分析;
a字符串: B B E C E b字符串: D C C E B
分析;此题类型和求两字符串最长公共子序列有相同部分,但最长公共序列对相同字符位置没有要求,但在此题中则是解题关键,
若两位置相同,则不需任何操作,但若两相同部分之间相错n位,则需增加n次操作,同时还要考虑最优解;
同时dp[i][0]=dp[0][i]=i;
<pre name="code" class="cpp">#include<stdio.h> #include<cstring> #include<iostream> using namespace std; char a[1005],b[1005]; int dp[1005][1005]; int main() { int i,j,k,s; while(~scanf("%s%s",a,b)) { k=strlen(a); s=strlen(b); for(i=0;i<=k;i++) dp[0][i]=i; for(i=0;i<=s;i++) dp[i][0]=i; for(i=1;i<=k;i++) for(j=1;j<=s;j++) { if(a[i-1]==b[j-1]) dp[i][j]=dp[i-1][j-1]; else { dp[i][j]=min(dp[i-1][j-1],min(dp[i-1][j],dp[i][j-1]))+1; } } printf("%d\n",dp[k][s]); } return 0; }