1. 实践题目
7-3 编辑距离问题
2. 问题描述
设A和B是2个字符串。要用最少的字符操作将字符串A转换为字符串B。这里所说的字符操作包括 (1)删除一个字符; (2)插入一个字符; (3)将一个字符改为另一个字符。 将字符串A变换为字符串B所用的最少字符操作数称为字符串A到 B的编辑距离,记为d(A,B)。 对于给定的字符串A和字符串B,计算其编辑距离 d(A,B)。
输入格式:
第一行是字符串A,文件的第二行是字符串B。
提示:字符串长度不超过2000个字符。
输出格式:
输出编辑距离d(A,B)
输入样例:
在这里给出一组输入。例如:
fxpimu
xwrs
输出样例:
在这里给出相应的输出。例如:
5
3. 算法描述
1 #include
2 #include
3 using namespacestd;4
5 stringA, B;6 intn1, n2;7 int n[2002][2002];8
9 intmain()10 {11 getline(cin, A);12 getline(cin, B);13 int a =A.length();14 int b =B.length();15 for(int i=1; i<=a; i++)16 {17 n[i][0] =i;18 }19 for(int j=1; j<=a; j++)20 {21 n[0][j] =j;22 }23 for(int i=1; i<=a; i++)24 {25 for(int j=1; j<=b; j++)26 {27 if(A[i-1]==B[j-1])28 {29 n[i][j] = n[i-1][j-1];30 }31 else
32 {33 n[i][j] = min(min(n[i-1][j]+1, n[i][j-1]+1),n[i-1][j-1]+1);34 }35 }36 }37 cout <
4. 算法时间&空间复杂度分析
代码第23行到36行是本程序中嵌套层数最多的地方,共嵌套2层for循环,因此,算法时间复杂度级别为O(n2)。
由于本程序开辟了一个二维数组来存放从i到j的最短编辑距离,因此,算法空间复杂度级别也为O(n2)。
5. 心得体会
我在初次看到这题的时候,由于题目内容涉及到字符串的处理,我又最近自学了Python 3,深感Python字符串处理的简便,于是使用Python以相同的递归方程写了代码提交,测试结果为:
测试点0答案正确,耗时220ms,内存36116KB;测试点1答案正确,耗时215ms,内存35880KB;测试点2运行超时。
在进行各种尝试都无法成功使程序通过2号测试点的测试后,想到是与语言相关的问题,于是按同一个方程写C++程序,一遍过,三个测试点的耗时分别为3 / 5 / 44ms,内存占用分别为384 / 512 / 11436KB。
Python是一种动态类型、解释型的语言。查阅资料得知,其万物皆对象的特性就是导致其运行慢的一个原因,Python的对象模型会带来低效的内存访问。
因此,对于时间和内存要求不高的题目可以用Python写(缩进为主的代码风格可读性强,编写简单),如果要求较高,还是使用C++为好。
经过这次实践,我还发现了C++里面#include 之后string类的操作其实也非常便捷,并不输给Python,需要掌握这种用法。