Description
编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
例如将kitten一字转成sitting:
sitten (k->s)
sittin (e->i)
sitting (->g)
所以kitten和sitting的编辑距离是3。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。
给出两个字符串a,b,求a和b的编辑距离。
Input
第1行:字符串a(a的长度 <= 1000)。
第2行:字符串b(b的长度 <= 1000)。
Output
输出a和b的编辑距离
Input示例
kitten
sitting
Output示例
3
解题思路
类似于LCS,在两个字符串之间做比较,
dp[i][j]标记字母串a的前i 个字符转换到字符串b的前j 个字符的最小编辑距离,
则dp[0][i]=i,dp[i][0]=i,
dp[i][j]=min(dp[i-1][j]+1,dp[i][j-1]+1,dp[i-1][j-1]+(stra[i-1]==strb[j-1]?0:1).
代码实现
#include<bits/stdc++.h>
using namespace std;
#define IO ios::sync_with_stdio(false);\
cin.tie(0);\
cout.tie(0);
typedef long long ll;
#define maxn 1007
int dp[maxn][maxn];
char str1[maxn],str2[maxn];
int main()
{
IO;
cin>>str1>>str2;
int m=strlen(str1);
int n=strlen(str2);
for(int i=1;i<=n;i++) dp[0][i]=i;
for(int i=1;i<=m;i++) dp[i][0]=i;
for(int i=1;i<=m;i++)
{
for(int j=1;j<=n;j++)
{
dp[i][j]=min(dp[i-1][j],dp[i][j-1])+1;
dp[i][j]=min(dp[i][j],dp[i-1][j-1]+(str1[i-1]==str2[j-1]?0:1));
}
}
cout<<dp[m][n]<<endl;
return 0;
}