KMP算法原理

最新推荐文章于 2024-07-20 09:21:06 发布

iSaber-

最新推荐文章于 2024-07-20 09:21:06 发布

阅读量54

点赞数

文章标签：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Lover_Saber/article/details/133282831

版权

KMP

考虑在字符串 $S$ 中找到所有字符串 $P$ 的出现位置。

1.暴力算法

首先最直接的想法就是逐位比较，不一样则 $P$ 向右移动一位就从头开始

设 $S = ab c ab c ab cc$ $T = ab c ab cc$ , 则过程为

请添加图片描述

2.优化

每次失配时， $T$ 只向右移动一位，且 $S$ 都要退回到 $T$ 开头对应位置重新开始匹配，这样会使得时间复杂度变成 $O (NM)$ 。

现在我们需要匹配时 $S$ 不退回，每次都从失配时的位置开始匹配，且 $T$ 向右移动多位，这样大大优化时间。

假设我们在某一段已经匹配好了，但是下一位出现失配，我们考虑如何优化

请添加图片描述

比如这里 $a$ 和 $c$ 失配了, 考虑将 $T$ 向后移动

我们要保证 $S$ 不回退，那么就需要我们把 $T$ 向后移动到一个特别的位置，使得 $S$ 以 $a$ 前面一位结尾的后缀已经和 $T$ 的前置匹配好了，这样我们就不用回退 $S$ 。

请添加图片描述

如上图的刚好以 $a$ 前一个位即 $c$ 结尾的后缀 $ab c$ 和 $T$ 中的前缀 $ab c$ 一样，所以我们只需把 $T$ 移动到相应位置 $S$ 就不用回退了。

请添加图片描述

因为前面已经匹配好了。

那么现在的问题就是怎么找 $T$ 移动多少位？

请添加图片描述

考虑上图，蓝色部分为已经匹配了，在 $T$ 等于 $d$ 时失配，假设找到了一处 $S$ 后缀和 $T$ 前缀相等（下图黄色部分），

那么必定有** $T$ 的后缀和 $T$ 的前缀相等**（如下图），因为在失配的字符前都是已经匹配好了的，即上图蓝色的部分是对应相等的。

请添加图片描述

所以我们只需要在 $T$ 中找到它前缀和后缀相等的最长串称为最长公共前后缀（为什么要最长？），然后移动到相应位置即可。

请添加图片描述

但是如果我们发现还是不匹配怎么办呢？就重复刚才的过程，只是刚刚黄色的部分变成了蓝色的部分。

请添加图片描述

我们只要先预处理出来在 $T$ 每个位置失配时这个最长公共前后缀的长度，每次失配时就知道该移动多少，就能大大加快算法了。

到目前为止我们就了解了 $K MP$ 算法的主要思路了

即失配时， $T$ 向右移动到合适位置，使得 $S$ 不退回，每次都从失配时的位置开始匹配！

3.Next 数组

我们要先预处理出来在 $T$ 每个位置失配时这个最长的前缀后缀的长度，不妨叫这个数组为 $n e x t$ 数组

我们考虑通过递推的方式求出这个数组，假设箭头 $p$ 前的最长前缀后缀的长度都求出来了，

通过前面的这些信息我们求出 $p$ 处的最长前缀后缀等于多少。

请添加图片描述

假设蓝色部分就是 $p - 1$ 处即上一位的最长公共前后缀。

如果说他们的下一位都相等，即红色部分相等，那么 $p$ 处的最长公共前后缀等于 $p - 1$ 处的加一 (next[p] = next[p - 1] + 1)

如果不相等就要找一个最长的黄色的部分 $S 1$ 他要和 $T$ 的同样长的前缀 $S 2$ 相等（如下图），

然后我们知道 $S 3 = S 2$ ，因为上图蓝色部分对应相等。

$S 1$ 的长度就等于 $S 3$ 结尾处的最长公共前后缀的长度 ，

请添加图片描述

然后比较 $p$ 处的字符是否和 $S 2$ 后一个相等，相等了 next[p] 就等于 $S 2$ 长度加一。

如果还是不等就重复前面的过程直到相等或者公共前后缀为零。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
KMP算法原理

考虑在字符串S中找到所有字符串P的出现位置。
复制链接

扫一扫

iSaber- CSDN认证博客专家 CSDN认证企业博客

码龄6年

5: 原创

35万+: 周排名

32万+: 总排名

2532: 访问

: 等级

73: 积分

3: 粉丝

4: 获赞

1: 评论

0: 收藏

私信

关注

热门文章

最新评论

KMP算法原理
CSDN-Ada助手: 恭喜您写了第5篇博客，题为“KMP算法原理”！您的持续创作展示了您对技术的热情和扎实的知识基础。对于这篇博客，您清楚地介绍了KMP算法的原理，给读者提供了宝贵的学习资源。在下一步的创作中，我建议您可以进一步拓展这个主题，例如分享一些实际应用案例或者深入探讨算法的优化方法。这样可以让读者更加全面地了解KMP算法，并能够更好地应用于实际开发中。谦虚的态度是我们不断进步的动力，相信您会在后续的创作中继续取得更好的成果。期待您的下一篇博客，再次祝贺您！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。