编辑距离:就是两个字符串之间,由一个转化为另一个所需的最少编辑操作次数。
许可的编辑操作包括将
(1)一个字符替换为另一个字符;
(2)插入一个字符;
(3)删除一个字符;
可以用动态规划解决这道题目:
设原始串是S[1,....n] ,目标串是T[1,.....m];
设d[i][j]表示子串S[1,...i] 转化为子串T[1,....j]的最短编辑距离。
那么结果就是 d[n][m];
状态转移方程为
d[i][j]=min{
d[i-1][j-1]+cost; //把原始串S的第i个字符替换为目标串T的第j个字符。如果S[i]==T[j],cost=0,否则为1.
d[i-1][j]+1 ; //把原始串S的第i个字符删除
d[i][j-1]+1 ; // 在原始串S的第i个字符之后插入一个跟T[j]相同的字符。
}
复杂度是O(n*m)
推荐 poj1035
下面是用动态规划实现的编辑距离代码。
#include <iostream>
#include <algorithm>
#include <cstdio>
#include <cmath>
#include <string>
#include <vector>
using namespace std;
const int maxn = 100;
char a[maxn];
char b[maxn];
int d[maxn][maxn];
int main()
{
while(scanf("%s %s",a+1,b+1)!=EOF)
{
int la=strlen(a+1);
int lb=strlen(b+1);
memset(d,0,sizeof(d));
for(int i=1;i<=la;i++)
d[i][0]=i;
for(int i=1;i<=lb;i++)
d[0][i]=i;
for(int i=1;i<=la;i++)
{
for(int j=1;j<=lb;j++)
{
if(a[i]==b[j])
d[i][j]=d[i-1][j-1];
else
d[i][j]=d[i-1][j-1]+1;
if(d[i-1][j]+1<d[i][j])
d[i][j]=d[i-1][j]+1;
if(d[i][j-1]+1<d[i][j])
d[i][j]=d[i][j-1]+1;
}
}
printf("%d\n",d[la][lb]);
}
return 0;
}