实践题目:编辑距离问题
设A和B是2个字符串。要用最少的字符操作将字符串A转换为字符串B。这里所说的字符操作包括 (1)删除一个字符; (2)插入一个字符; (3)将一个字符改为另一个字符。 将字符串A变换为字符串B所用的最少字符操作数称为字符串A到 B的编辑距离,记为d(A,B)。 对于给定的字符串A和字符串B,计算其编辑距离 d(A,B)。
输入格式:
第一行是字符串A,文件的第二行是字符串B。
提示:字符串长度不超过2000个字符。
输出格式:
输出编辑距离d(A,B)
输入样例:
在这里给出一组输入。例如:
fxpimu
xwrs
输出样例:
在这里给出相应的输出。例如:
5
算法描述
解决这道问题的大致思路是:将字符串A从0开始逐步变成字符串B的最短的编辑距离。
具体使用动态规划的方法填表实现:
①创建动态二维数组dp
int **dp = new int*[b.length() + 1];
for (int i = 0; i < b.length() + 1; i++)
dp[i] = new int[a.length() + 1];
②当一个字符串为空时,则编辑距离为另一字符串的长度
for (int i = 0; i < a.length() + 1; i++)
dp[0][i] = i;
for (int i = 0; i < b.length() + 1; i++)
dp[i][0] = i;
③建立双重循环,不断填入dp[i][j],若字符串A[j - 1] == B[i - 1], 则 dp[i][j] = dp[i - 1][j - 1] ,即不需要进行编辑;若字符串A[j - 1] != B[i - 1],则在 dp[i][j - 1], dp[i - 1][j], dp[i - 1][j - 1]) + 1 所储存的数据进行比较,取最小值加上1即为dp[i][j]的值。
④题目所求的字符串A转换成字符串B的编辑距离为 dp[b.length()][a.length()]
算法时间及空间复杂度分析
算法采用动态规划的思想且通过填表的策略,设字符串A的长度为m,字符串B的长度n。则在每一步的操作中所用的时间为:
①创建二维数组:o(n);
②填表:o(m) + o(n);
③填表:o(m * n);
综上,本题所用算法的时间复杂度为o(m * n)。
而程序中开辟的辅助空间主要为二维数组dp,故空间复杂度为o(m * n)。
//编辑距离问题
#include <iostream>
#include <string>
using namespace std;
int min(int a, int b, int c)
{
int min = a;
if (min > b)
min = b;
if (min > c)
min = c;
return min;
}
int solve(string a, string b)
{
//创建动态数据dp,行为b.length()+1,列为a.lenth()+1, +1指其中一个字符串为空的时候的编辑距离
int **dp = new int*[b.length() + 1];
for (int i = 0; i < b.length() + 1; i++)
dp[i] = new int[a.length() + 1];
//当其中一个字符串为空时,编辑距离为另一个字符串的长度
for (int i = 0; i < a.length() + 1; i++)
dp[0][i] = i;
for (int i = 0; i < b.length() + 1; i++)
dp[i][0] = i;
for(int i = 1; i < b.length() + 1; i++)
for (int j = 1; j < a.length() + 1; j++)
{
if (a[j - 1] == b[i - 1])
dp[i][j] = dp[i - 1][j - 1];
else
dp[i][j] = min(dp[i][j - 1], dp[i - 1][j], dp[i - 1][j - 1]) + 1;
}
return dp[b.length()][a.length()];
}
int main()
{
string a, b;
cin >> a >> b;
cout << solve(a, b);
return 0;
}