KMP(MP)算法详解

最新推荐文章于 2024-09-11 23:24:56 发布

WenDavidOI

最新推荐文章于 2024-09-11 23:24:56 发布

阅读量3.3k

点赞数

分类专栏：算法总结文章标签： kmp 算法回顾

本文链接：https://blog.csdn.net/wendavidoi/article/details/52143981

版权

算法同时被 2 个专栏收录

30 篇文章 1 订阅

订阅专栏

总结

23 篇文章 0 订阅

订阅专栏

Written with StackEdit.
由于CSDN服务器的维护，我迫不得已地用了和CSDN版本相近的StackEdit

$\mathrm{KMP}$ 算法，是一种字符串匹配的算法。当然，我们已经学过了一两种字符串匹配算法，先来稍微回顾一下。
首先是暴力匹配，也就是将串中每一个长度等于另一串的子串和另一串进行匹配。若两串的长度为 $n$ 和 $m$ ，那么其的时间复杂度显然是 $\text O(nm)$ 。
然后是哈希。哈希在本质上是一种概率算法，实际上是采用了一种映射的方法，如果将所有被哈希之前的字串的集合设为 $A$ ，而被哈希之后的字串的哈希值集合设为 $B$ ，那么也就相当于定义了一个映射 $Hash:A\to B$ ，注意这不是一个单射，因为在大多数的情况下，有 $|A|<|B|$ 。当然，有很多方法改进，但是只有完美哈希使得它不再算一个概率算法，然而完美哈希本身的操作过于繁琐，一般适用于字串不变的情况，如编译器中的指令。实际上，哈希算法的本质和暴力是一致的，但是由于映射的存在，使得哈希算法要比较的东西就不那么多了，就像暴力算法中只抽样比几位一样，但是哈希算法相当于是在每一位中都抽一点点的样（有些时候不是这样），所以更为准确一些。其的时间复杂度为 $\Theta(n+m\log_{v}Mod)$ ，其中 $v$ 是计算机所采用的进位制（如现在的一般采用二进制，不排除以后有更高进制的计算机，或者要求相关的交互题:)）， $Mod$ 则是你所使用的模数（因为我们当时只学了一种哈希:-(）。
好吧，回顾完了，我们来稍微了解一些关于 $\mathrm{KMP}$ 的东西。 $\mathrm{KMP}$ 的本质是暴力匹配的优化，而其有一个较为简单的版本， $\mathrm{MP}$ 。本文介绍时将先介绍 $\mathrm{MP}$ 算法，再比较 $\mathrm{KMP}$ 与 $\mathrm{MP}$ 之间那一个 $\mathrm {'K'}$ 的不同。
考虑暴力算法，其思路大致是用指针 $i$ 和 $j$ 分别遍历两个串，然后当失配（即两个指针对应的字符不相等时）回到两个串“前面的位置”，也就是像回溯一样不断尝试。
但是，这样单纯地找，有时是不会有好结果的。如下所示，两个串 $A$ 和 $B$ ：