KMP算法是经典的字符串匹配算法,在串行时时间复杂度为线性。KMP算法的思想很简单,将参与匹配的模式串部分视为周期串(最短)后接前缀串,周期串重复出现次数记为K,周期串长度记为L。当模式串的第j位与正文串第k位比较时(假设模式串首位与正文串第x位比较),如果字符不相同,最简单的方法是将模式串相对于正文串的位置向后移动一位,即模式串从正文串第x+1位开始匹配。当参与匹配的模式串部分K大于1时,从x+1到x + L开始的匹配都是无意义的,因为如果能够再次匹配到k这个位置,则证明周期串不是最小的,这与周期串的定义矛盾。因此在模式串的第j位与正文串的第k位匹配失败后,直接将模式串后移L位,正文串第k+1位开始与模式串j-L位开始比较就可以了,这样,正文串中的每个字符在算法中,只参与一次比较,算法的时间串行时间复杂度为线性。
KMP算法的关键是要计算一个next数组,在这里有详细讲解:https://www.cnblogs.com/yjiyjige/p/3263858.html
也有的地方叫做失效函数,今天看书的时候有点看不懂,看完了写了一点笔记,抄录上来以便日后查阅
输入:模式串P[1 : m]
输出:失效函数F(k), 1 ≤ k ≤ m + 1
Begin
F(1