编程之美---计算字符串的相似度
在比较字符串是否相同时,我们经常要考虑两个字符串的编辑距离,所谓编辑距离就是通过修改、删除、插入等三种操作使两个字符串相等所需要的步数。字符串的相似度定义为编辑距离加1 的倒数。具体分析过程在此不再赘述。
在编程之美中提出了递归的解决方法,但是在递归过程中有子问题被重复计算,因此在参考[1]算法引论书中提到了动态规划的思想解决该问题,在字符串比较过程中存在解最优子问题的情况,因此动态规划适用于此处。为了避免重复计算,把子问题的解存储起来。
递归代码如下:
在上述两个算法的运行结果中,我遇到了一个问题,对于一些字符串的计算结果是不同的,比如"kitting"和"sittin"我想了很长时间也没想明白怎么回事,希望高手指点,谢谢!