文章目录
一、前言
如果一块表走的不准,那它的每一秒都是错的,但如果这块表停了,那它起码每天有两次是对的;
没错,清醒的停留胜过盲目的前行!
及时回顾下自己这段时间学过的东西,并且加以总结,精益求精,总比学了一大堆,然后忘记在灯火阑珊处要好得多!
二、最小编辑距离的定义
- 编辑距离是对两个字符串(或者序列)的差异化度量,看至少需要多少次的操作才能将一个字符串变成另一个字符串。我们一般所说的编辑距离就是指最小编辑距离。
- 编辑距离可以应用于自然语言处理中,比如在拼写检查时可以根据一个拼错的词和其他正确的词的编辑距离大小,来判断哪个是比较可能的词。或者应用于生物学的 DNA 的相似程度判定、两段文本内容的 diff 等等。
- 最小编辑距离和之前提到的最长公共子序列的问题有着异曲同工之妙,状态转移方程也比较类似。
1、莱文斯坦距离
- 莱文斯坦距离,即 Levenshtein Distance,是指对于两个字符串(源字符串和目标字符串),由源字符串转变成目标字符串所需的最少编辑次数。允许的编辑操作包括以下三种:
- 1)Replace:将源字符串中的一个字符替换成另一个字符;
- 2)Insert:在源字符串中插入一