编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
例如将kitten一字转成sitting:
sitten (k->s)
sittin (e->i)
sitting (->g)
所以kitten和sitting的编辑距离是3。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。
给出两个字符串a,b,求a和b的编辑距离。
Input
第1行:字符串a(a的长度 <= 1000)。 第2行:字符串b(b的长度 <= 1000)。
Output
输出a和b的编辑距离
Input示例
kitten sitting
Output示例
3
思路:对于两个字符串s和t,dp[i][j]记录s的前i个字符转换到t的前j个字符的最小编辑距离。那么很容易得到转移方程 dp[i][j] = min(dp[i][j], dp[i-1][j-1] + s[i-1] == t[j-1] ? 0 : 1)。对每个dp[i][j],我们考虑直接从dp[i-1][j]或dp[i][j-1]加一个字符,所以初始为dp[i][j] = min(dp[i-1][j], dp[i][j-1]) + 1。对于dp[0][i]和dp[i][0],显然都等于i。
代码:
#include<iostream>
#include<cstring>
using namespace std;
int dp[1010][1010]; //a的前i个字符到b的前j个字符的最小编辑距离
int main()
{
char a[1010];
char b[1010];
cin>>a;
cin>>b;
int n1=strlen(a);
int n2=strlen(b);
for(int i=0;i<=n1;i++)
dp[i][0]=i;
for(int i=0;i<=n2;i++)
dp[0][i]=i;
for(int i=1;i<=n1;i++)
{
for(int j=1;j<=n2;j++)
{
dp[i][j]=min(dp[i-1][j],dp[i][j-1])+1;
dp[i][j]=min(dp[i][j],dp[i-1][j-1]+(a[i-1]==b[j-1]?0:1)); //第i项就是a[i-1]
}
}
cout<<dp[n1][n2]<<endl;
return 0;
}