kmp算法详解

最新推荐文章于 2024-08-16 17:43:39 发布

eskimoer

最新推荐文章于 2024-08-16 17:43:39 发布

阅读量1.5k

点赞数 2

分类专栏：算法文章标签： kmp算法 C++

本文链接：https://blog.csdn.net/ddupd/article/details/19899263

版权

KMP算法是一种高效的字符串匹配算法，改进自BF算法。当遇到字符不匹配时，KMP算法维持母串游标不动，模式串向右移动。其核心是利用预计算的next数组确定匹配失败后的移动位置，避免无效的回溯。KMP算法通过递推思想求取next数组，并提供了多种实现方式，如Kmp1、Kmp2和Kmp3。

摘要由CSDN通过智能技术生成

KMP算法详解

KMP算法简介：

KMP算法是一种高效的字符串匹配算法，关于字符串匹配最简单的就是BF算法。BF算法是用两个游标分别指向母串S，模式串T，从开头向后面依次比较字符是否相等，如果相等继续同时向后滑动两个游标，不相等的话，T的游标回溯至开头，S的游标回溯至起初游标的下一位，这种算法原理非常简单，小学生都可以想的到。

KMP算法是在BF算法的基础上加以改进的，它的特点是在遇到字符不匹配时候维持母串T的游标不动，而把模式串向右移动，具体移动到哪一个元素下标，这就是算法的核心思想之处了。

假如母串的i处和模式串的j处不匹配，那么就令k=next（j），表示的意思就是：模式串在j处出现不匹配现象，此时应该将模式串向后一定到下标为k的游标处，在此与之前不匹配的元素进行比较。

Kmp算法的本质：

如图所示：

在下标j处出现不匹配，则k = next（j），表示此时应该把下标k移动到原本j对应的位置处，用T[k]跟s[i]进行对比。如果满足这样的条件，则有T[0],T[1],…T[k-1] = S[i-k],S[i-k+1],…S[i-1]

又因为j之前的字符串跟S都匹配，所以又有T[j-k],T[j-k+1],…T[j-1] = S[i-k],S[i-k+1],…S[i-1].所以得出 T[0],T[1],…T[k-1] = T[j-k],T[j-k+1],…T[j-1]。也就是说图中被标记出来前后两个区域的字符串相等，KMP算法的本质就是找出最大的这样一个k值满足T[0],T[1],…T[k-1] = T[j-k],T[j-k+1],…T[j-1]。

K值的求取方法：

K值的求取用到了数学中的递推的思想，求取K值只跟模式串T自身有关，跟母串S半毛钱关系都没有。先假设已经有 next(j) = k,接下来我们就去求next（j+1）的值。这个要分情况讨论:

如果T[k] = T[j]那么就很容易得到 next(j+1) = k+1 = next(j) + 1;

如果T[k] != T[j]，那么