题目:
https://vjudge.net/problem/HDU-1516
这里转载一篇看到的比较好的编辑距离的讲解
https://blog.csdn.net/ac540101928/article/details/52786435
这里再加上一点我自己的理解:这里的插入、替换和删除的操作都是对最后一个字符而言
dp[i][j]用来存储字符串s[i]到字符串t[j]的编辑距离
当i=0 j=0 时可以建立最初的dp矩阵,然后根据这个矩阵再依次推出后面的dp的值
如删除操作:dp[i][j] = 1 + dp[i-1][j];表示本次的编辑距离为 1(代表长度为i的字符串的删除操作)+dp[i-1][j](长度为i的字符串除去被删除的长度的之前的编辑距离)
因为有最初的一行和一列,所以整个表都可以被算出来,取右下角的值的原因是,右下角代表长度为len1和len2的字符串的编辑距离,即代表所要求的字符串的编辑距离
#include <stdio.h>
#include <string.h>
#include <algorithm>
using namespace std;
char s1[100],s2[100];
int dp[100][100];
int step;
int len1,len2;
void solve()
{
memset(dp,0,sizeof(dp));
for(int i = 0; i <= len1; i++)
dp[i][0] = i;
for(int i = 0; i <= len2; i++)
dp[0][i] = i;
for(int i = 1; i <= len1; i++)
{
for(int j = 1; j <= len2; j++)
{
if(s1[i-1] == s2[j-1]) //判断当前字符是否相等
dp[i][j] = dp[i-1][j-1];
else
dp[i][j] = min(min(dp[i][j-1]+1, dp[i-1][j]+1),dp[i-1][j-1]+1);
}
}
}
void path()
{
int tmp;
int i,j;
for(i = len1,j = len2;;)
{
if(i < 1 && j < 1) //必须两个字符串都小于1
break;
if(s1[i-1] == s2[j-1]) //判断当前字符是否相等
tmp = 0;
else tmp = 1;
//可以理解为如果这一步是替换操作,那么这一步的dp等于前面所有的dp的值加上这一步替换所走的距离temp
if(dp[i][j] == dp[i-1][j-1]+tmp && i >= 1 && j >= 1)//因为替换操作的完成之后对两个字符串都要前移,所
{ // 以确保i>=1&&j>=1 这样移动之后i和j都大于等于0
if(tmp) //替换,i--,j--;
printf("%d Replace %d,%c\n",++step,i,s2[j-1]);
//替换之后最后面一个字符都相等,所以都向前挪动一个
i--;
j--;
}
else if(dp[i][j] == dp[i-1][j]+1 && i >= 1)//删除i,i--
{ // 因为删除操作之后只对第一个字符串前移,所以只用确保第一个字符串移动之后>=0
printf("%d Delete %d\n",++step,i);
i--;
}
else if(dp[i][j] == dp[i][j-1]+1 && j >= 1)//增加i+1处,j--
{
printf("%d Insert %d,%c\n",++step,i+1,s2[j-1]);
//第i+1处增加之后,第一个字符串的第i+1处和第二个字符串的j处相等,所以 j--;
j--;
}
}
}
int main()
{
while(~scanf("%s %s",s1,s2))
{
len1 = strlen(s1);
len2 = strlen(s2);
solve();
printf("%d\n",dp[len1][len2]);
step = 0;
path();
}
return 0;
}