KMP辨析

estelea

已于 2024-05-12 12:21:27 修改

阅读量745

点赞数 19

文章标签：数据结构算法

于 2024-05-12 12:21:25 首次发布

本文链接：https://blog.csdn.net/estelea/article/details/138751707

版权

前言

KMP算法真是每一次看都会让我有新的认知，今早本想利用昨天晚上读的labuladong详解中的求一个next数组时，结果居然不一样。再次拜读后发现，两者不完全是一个东西，但是在许多教程中两者会被混为一谈，也有可能是因为大家对next数组都有各自的理解。

最后总结了自己看到过的一些关于KMP算法的博客，发现有三个东西经常提到，一个next数组，另外两个是Partial Match Table（部分匹配表），前缀表。三者的最终结果有时是一样的，有时是不一样的，这是因为他们各自的侧重点有所不同。

想要搞懂原理，还是得采纳多方意见，虽然在这一过程中你会遇上无数矛盾的点。如果只是想知道怎么算，考研书上属实是讲的横清楚。领悟这个数组是用什么方法得到的还是有点难度的，但是记住还是挺轻松的。

具体区别

求解步骤上

next数组,部分匹配值（以第一个元素的next值为next[1] ）
- next[1] = 0 ; next[2] = 1
- 其他next，在不匹配的位置j前，划一条线分割。模式串往后退（即分割线左侧的字母越来越少），直到分割线之前能对上，或模式串完全跨过分界线为止。此时j指向哪，next就是几。
前缀表
- 利用前后缀的关系
  - 前缀是指不包含最后一个字符的所有以第一个字符开头的连续子串。
  - 后缀是指不包含第一个字符的所有以最后一个字符结尾的连续子串。
- 长度为前3个字符的子串aab，最长相同前后缀的长度为0。
  
  以此类推：长度为前4个字符的子串aaba，最长相同前后缀的长度为1。长度为前5个字符的子串aabaa，最长相同前后缀的长度为2。长度为前6个字符的子串aabaaf，最长相同前后缀的长度为0。
- 通过目测法来求或者用上述next数组方法来求，结果是一样的。

原理参考链接

如何更好地理解和掌握 KMP 算法? - 知乎：这篇文章提供了一个较为易懂的解释，并且使用了二维的dp数组来重新定义元素的含义，使得代码长度减少，可解释性提高。
代码随想录：这篇文章提供了KMP算法的详细解释和C++实现。
阮一峰的网络日志：阮一峰的文章以较为通俗的语言解释了KMP算法。
The Knuth-Morris-Pratt Algorithm in my own words：Jake Boxer的文章以自己的理解解释了KMP算法。
【KMP】从原理上详解next数组和nextval数组-CSDN博客：这篇文章详细解释了KMP算法中的next数组和nextval数组的区别。

现在普遍的KMP实现算法中的next数组又在记录什么？关于这个问题，似乎很少有人进行解释，但这个问题却很容易让人困惑。因为现在普遍的KMP实现算法中所谓的next数组记录的东西和前面所说的next数组以及nextval数组是有区别的。

为了进行区分，我们称这些KMP实现算法中的next数组为Knext数组。

虽然Knext数组在使用时的功能和next数组以及nextval数组相似，但是其记录的内容和求解方法却与next以及nextval有着很大不同。

由于nextval与next没有本质区别，我们单比较Knext与next之间的异同。

相同之处 Knext和next都是为了提高算法效率，让串的匹配快速找到下一个可能的起始位置，避免文本串指针的回退。 Knext和next的求解过程都属于动态规划，需要依赖于之前求解出的Knext值和next值。不同之处 Knext记录的是到对应位为止的最长相等前后缀的长度。

拓展：最长前缀后缀 (LPS) 数组

https://hf.co/chat/r/8Uw7yAo

estelea

关注

19
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
KMP辨析

KMP算法真是每一次看都会让我有新的认知，今早本想利用昨天晚上读的labuladong详解中的求一个next数组时，结果居然不一样。再次拜读后发现，两者不完全是一个东西，但是在许多教程中两者会被混为一谈，也有可能是因为大家对next数组都有各自的理解。最后总结了自己看到过的一些关于KMP算法的博客，发现有三个东西经常提到，一个next数组，另外两个是Partial Match Table（部分匹配表），前缀表。三者的最终结果有时是一样的，有时是不一样的，这是因为他们各自的侧重点有所不同。想要搞懂原理，还是得
复制链接

扫一扫