KMP算法关键思想总结

最新推荐文章于 2024-07-18 17:11:08 发布

Arishension

最新推荐文章于 2024-07-18 17:11:08 发布

阅读量964

点赞数

分类专栏：数据结构文章标签： KMP算法数据结构

本文链接：https://blog.csdn.net/qq_43457714/article/details/99546452

版权

KMP算法通过分析子串前后缀优化模式匹配，避免BF算法中不必要的回溯，提高效率。核心在于构建next数组，表示子串中前缀与后缀的最大公共长度。算法实现包括匹配过程中的状态转移，当匹配失败时，根据next数组移动子串位置。KMP算法适用于处理大量数据，如外设输入文件。

摘要由CSDN通过智能技术生成

KMP算法的关键思想总结

kmp算法的核心在于其优化了模式匹配失配时的开销，在BF算法中失配时直接将主串指针回溯至开始本次匹配的下一个位置，这样使得失配开销略大，效率不高。
而kmp算法通过分析子串的结构，对子串失配时的情况进行了简单分析，以O(n+m)的时间复杂度替换了O(n*m)的时间复杂度，优化了模式匹配的性能。那么kmp算法是如何做到这一点的呢？

其要点在于：kmp算法对子串的前后缀进行了简要分析，举个例子：

主串 EKKLABCDEFGH666ABCDEFGHABCDEFGHPPJGABCDPPHMBVRTTY
子串     ABCDEFGH666ABCDEFGHPP

显然匹配到P处时失配，若是BF算法，则此时要将主串回溯至(EKKLA)B，我们会认为这种处理稍显笨拙，于是我们分析子串的前后缀发现，其最大相等前后缀为ABCDEFGH，长度为8，这给我们一个提示：既然串首和串尾有一部分是重复的，那么我们还需要回溯重新比较吗？当然不用，我们直接找到最大长度的重复串然后只进行子串移动就完美解决了，于是我们不用再回溯主串，直接将子串移动到这里：

 主串 EKKLABCDEFGH666ABCDEFGH666ABCDEFGHPPJGABCDPPHMBVRTTY
 子串                ABCDEFGH666ABCDEFGHPP

毫无疑问这会大大提升算法的效率，在对处理从外设输入的庞大文件很有效，可以边度如边匹配，而无需回头重读。

下面介绍一下next数组的计算方法：

1.首先

最低0.47元/天解锁文章

Arishension

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录