动态规划
假设source有n个字符,target有m个字符,问题可定义为source[1...n]到target[1...n]的编辑距离。子问题可以定义为source前[1...i]到target前[1...j]的编辑距离(最优子结构)。因此,可以定义状态d[i,j]为从子串source[1...i]到子串target[1...j]之间的编辑距离。
状态递推关系方式分为两种情况,分别是source[i]等于target[j]和source[i]不等于target[j]:
d[i,j]=d[i-1,j-1] + 0; source[i]等于target[j]
d[i,j]=min(d[i,j-1]+1, d[i-1,j-1]+1, d[i-1,j]+1); source[i]不等于target[j]
边界条件:
d[i,0] = source字符串的长度
d[0,j] = target字符串的长度
如果两个字符相等,则在从此位置的左,上,左上三个位置中取出最小的值;若不等,则在从此位置的左,上,左上三个位置中取出最小的值再加上1;
第一次,源串第一个字符“j” 与目标串的“j”对比,左,上,左上三个位置中取出最小的值0,因为两字符相等,所以加上0;接着,依次对比“j”→“e”,“j”→“r”,“j”→“r”,,“j”→“y” 到扫描完目标串。
#include<stdio.h>
#include <string.h>
#define MAX_STRING_LEN 10
#define min(x,y) ( x<y?x:y )
int EditDistance(char* src, char* dest){
int i,j;
int d[MAX_STRING_LEN][MAX_STRING_LEN] = {0};
for (i = 0; i < (int)strlen(src); ++i) {
d[i][0] = i;
}
for (j = 0; j < (int)strlen(dest); ++j) {
d[0][j] = j;
}
for(i=1; i <= (int)strlen(src); i++){
for(j = 1; j <= (int)strlen(dest); j++){
if(src[i-1]==dest[j-1]){
d[i][j] = d[i-1][j-1];
}else{
int edIns = d[i][j-1] + 1;
int edDel = d[i-1][j]+1;
int edRep = d[i-1][j-1]+1;
d[i][j] =min(min(edIns,edDel),edRep);
}
}
}
for(int m = 0; m < MAX_STRING_LEN; m++){
for(int n = 0; n < MAX_STRING_LEN; n++)
printf("%d",d[m][n]);
printf("\n");
}
return d[strlen(src)][strlen(dest)];
}
int main(){
printf("%d\n", EditDistance("snowy", "sunny"));
}
完整版代码
#include<stdio.h>
#include<string.h>
#include<math.h>
#include<algorithm>
using namespace std;
int d[1010][1010];
int dis(char a[],char b[])
{
int i,j;
int la=strlen(a);
int lb=strlen(b);
for(i=0; i<la; i++)
d[i][0]=i;
for(j=0; j<lb; j++)
d[0][j]=j;
for(i=1; i<=la; i++)
for(j=1; j<=lb; j++)
{
if(a[i-1]==b[j-1])
d[i][j]=d[i-1][j-1];
else
{
d[i][j]=min(min(d[i-1][j]+1,d[i][j-1]+1),d[i-1][j-1]+1);
}
}
return d[la][lb];
}
int main()
{
char a[1010],b[1010];
gets(a);
gets(b);
int result=dis(a,b);
printf("%d\n",result);
}