题目要求:
问题描述:编辑距离是针对二个字符串的差异程度的量化量测,量测方式是看至少需要多少次处理才能将一个字符串变成另一个字符串。编辑距离可以用在自然语言处理中,例如拼写检查可以根据一个拼错的字和其他正确的字的编辑距离,判断哪一个(或哪几个)是比较可能的字。DNA也可以视为用A、C、G和T组成的字符串,因此编辑距离也用在生物信息学中,判断二个DNA的类似程度。
要求:给定两个序列,假设可以有插入、替换和删除(单个字符)三种编辑操作,设计算法求出这两个序列的最小编辑距离。
解题思路:
利用动态规划求解
根据题目要求列出状态方程:
动态规划代码实现:
优化求解:
动态规划方法的空间复杂度O(m*n)。空间优化:注意到c[i][j]只与c[i-1][j],c[i-1][j-1],c[i][j-1]有关,所以可以将二维数组变成一维数组来处理,即滚动数组,此方法将问题的空间复杂度降低到O(m) 。
优化代码: