描述:
设A和B是2个字符串。要用最少的字符操作将字符串A转换为字符串B。这里所说的字符操作包括:
(1)删除一个字符;
(2)插入一个字符;
(3)将一个字符改为另一个字符。
将字符串A变换为字符串B所用的最少字符操作数称为字符串A到B的编辑距离,记为d(A,B)。试设计一个有效算法,对任给的2个字符串A和B,计算出它们的编辑距离d(A,B)。
要求:
输入:第1行是字符串A,第2行是字符串B。
输出:字符串A和B的编辑距离d(A,B)
思路:
开一个二维数组d[i][j]来记录a0-ai与b0-bj之间的编辑距离,要递推时,需要考虑对其中一个字符串的删除操作、插入操作和替换操作分别花费的开销,从中找出一个最小的开销即为所求
具体算法:
首先给定第一行和第一列,然后,每个值d[i,j]这样计算:d[i][j] = min(d[i-1][j]+1, d[i][j-1]+1, d[i-1][j-1]+(s1[i]==s2[j]?0:1));
最后一行,最后一列的那个值就是最小编辑距离
二、算法分析
dp[i][j]表示a的前i个和b的前j个相同后的最短距离
dp[i][j]来自于三种状态{
1、删除,dp[i-1][j]+1;
2、插入,dp[i][j-1]+1;
3、替换,if(a[i]==b[j]) dp[i][j]=dp[i-1][j-1],else dp[i][j]=dp[i-1][j-1]+1;
三、代码:
- #include<stdio.h>
- #include<string.h>
- #include<algorithm>
- using namespace std;
- #define N 10
- int dp[N][N];//dp[i][j]表示a的前i个和b的前j个相同后的最短距离
- int main()
- {
- char a[N];
- char b[N];
- freopen("dInput.txt","r",stdin);
- freopen("doutput.txt","w",stdout);
- scanf("%s%s",a,b);
- int la=strlen(a);
- int lb=strlen(b);
- for(int i=1;i<=la;i++)
- dp[i][0]=i;
- for(int j=1;j<=lb;j++)
- dp[0][j]=j;
- for(int i=1;i<=la;i++)
- {
- for(int j=1;j<=lb;j++)
- {
- int insert=dp[i][j-1]+1;
- int deletes=dp[i-1][j]+1;
- int replace;
- if(a[i-1]==b[j-1])
- replace=dp[i-1][j-1];
- else
- replace=dp[i-1][j-1]+1;
- dp[i][j]=min(min(insert,deletes),replace);
- }
- }
- printf("%d\n",dp[la][lb]);
- return 0;
- }