代码随想录算法训练营第九天 | 28. 实现 strStr()，459.重复的子字符串

Cccccilu

已于 2023-10-20 12:56:21 修改

阅读量90

点赞数

文章标签：算法 c++ leetcode

于 2023-10-20 11:43:41 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Cccccilu/article/details/133940658

版权

28. 实现 strStr()

思路

KMP

KMP是由这三位学者发明的：Knuth，Morris和Pratt，所以取了三位学者名字的首字母。

KMP主要应用在字符串匹配上。

KMP的主要思想是当出现字符串不匹配时，可以知道一部分之前已经匹配的文本内容，可以利用这些信息避免从头再去做匹配了。所以如何记录已经匹配的文本内容，是KMP的重点，也是next数组肩负的重任。

next数组就是一个前缀表（prefix table）。前缀表是用来回退的，它记录了模式串与主串(文本串)不匹配的时候，模式串应该从哪里开始重新匹配。

比如要在文本串：aabaabaafa 中查找是否出现过一个模式串：aabaaf。

如动画所示：

可以看出，文本串中第六个字符b 和模式串的第六个字符f，不匹配了。如果暴力匹配，发现不匹配，此时就要从头匹配了。但如果使用前缀表，就不会从头匹配，而是从上次已经匹配的内容开始匹配，找到了模式串中第三个字符b继续开始匹配。前缀表会告诉你下一步匹配中，模式串应该跳到哪个位置。

最长公共前后缀（最长相等前后缀）

文章中字符串的前缀是指不包含最后一个字符的所有以第一个字符开头的连续子串。后缀是指不包含第一个字符的所有以最后一个字符结尾的连续子串。

前缀表求的就是相同前后缀的长度。

前缀表与next数组

很多KMP算法的实现都是使用next数组来做回退操作，那么next数组与前缀表有什么关系呢？

next数组就可以是前缀表，但是很多实现都是把前缀表统一减一（右移一位，初始位置为-1）之后作为next数组。

注意next数组是新前缀表（旧前缀表统一减一了）。

匹配过程动画如下：

构造next数组

定义一个函数getNext来构建next数组，函数参数为指向next数组的指针和一个字符串。

代码如下：

构造next数组其实就是计算模式串s，前缀表的过程。 主要有如下三步：

1. 初始化

定义两个指针i和j，j指向前缀末尾位置，i指向后缀末尾位置。

然后还要对next数组进行初始化赋值，如下：

2. 处理前后缀不相同的情况

因为j初始化为-1，那么i就从1开始，进行s[i] 与 s[j+1]的比较。

所以遍历模式串s的循环下标i 要从 1开始，代码如下：

如果 s[i] 与 s[j+1]不相同，也就是遇到前后缀末尾不相同的情况，就要向前回退。

怎么回退呢？

next[j]就是记录着j（包括j）之前的子串的相同前后缀的长度。那么 s[i] 与 s[j+1] 不相同，就要找 j+1前一个元素在next数组里的值（就是next[j]）。

所以，处理前后缀不相同的情况代码如下：

3. 处理前后缀相同的情况

如果 s[i] 与 s[j + 1] 相同，那么就同时向后移动i 和j 说明找到了相同的前后缀，同时还要将j（前缀的长度）赋给next[i], 因为next[i]要记录相同前后缀的长度。

代码如下：

最后整体构建next数组的函数代码如下：

使用next数组来做匹配

时间复杂度: O(n + m)
空间复杂度: O(m), 只需要保存字符串needle的前缀表

459.重复的子字符串

思路

移动匹配

当一个字符串s：abcabc，内部由重复的子串组成，那么这个字符串的结构一定是由前后相同的子串组成。

所以判断字符串s是否由重复子串组成，只要两个s拼接在一起，里面还出现一个s的话，就说明是由重复子串组成。

当然，我们在判断 s + s 拼接的字符串里是否出现一个s的的时候，要刨除 s + s 的首字符和尾字符，这样避免在s+s中搜索出原来的s，我们要搜索的是中间拼接出来的s。

时间复杂度: O(n)
空间复杂度: O(1)

Note: std::string::npos is a constant that holds the largest possible value of size_t type ( 18446744073709551615 on 64-bit systems ), which is an unsigned integer type. Hence, -1 corresponds to the actual value of std::string::npos.

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
代码随想录算法训练营第九天 | 28. 实现 strStr()，459.重复的子字符串

KMP是由这三位学者发明的：Knuth，Morris和Pratt，所以取了三位学者名字的首字母。KMP主要应用在字符串匹配上。KMP的主要思想是当出现字符串不匹配时，可以知道一部分之前已经匹配的文本内容，可以利用这些信息避免从头再去做匹配了。所以如何记录已经匹配的文本内容，是KMP的重点，也是next数组肩负的重任。next数组就是一个前缀表（prefix table）。前缀表是用来回退的，它记录了模式串与主串(文本串)不匹配的时候，模式串应该从哪里开始重新匹配。比如要在文本串：aabaabaafa 中查找
复制链接

扫一扫

Cccccilu CSDN认证博客专家 CSDN认证企业博客

码龄2年

32: 原创

133万+: 周排名

23万+: 总排名

6282: 访问

: 等级

320: 积分

4: 粉丝

0: 获赞

4: 评论

1: 收藏

私信

关注

热门文章

最新评论

代码随想录算法训练营第四天 | 24. 两两交换链表中的节点，19. 删除链表的倒数第N个节点，160. 链表相交，142. 环形链表II，链表总结
CSDN-Ada助手: 恭喜您写了第四篇博客！题目看起来很有深度，涵盖了许多链表相关的算法题目。您的持续创作精神值得赞赏！下一步，我建议您可以结合实际案例或者更深入的分析来进行创作，这样读者更容易理解并能够更好地应用这些算法。希望您继续保持并扩展您的创作势头！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
代码随想录算法训练营第九天 | 28. 实现 strStr()，459.重复的子字符串
CSDN-Ada助手: 恭喜您写完了第8篇博客！标题看起来非常有趣和具有挑战性。您在算法训练营的学习进度令人羡慕。在这篇博客中，您提到了实现 strStr() 和重复的子字符串问题，这些是非常常见和重要的算法问题。您的解析和思路是否可以分享给读者呢？希望您能继续保持创作的热情和耐心。下一步的创作建议是，可以尝试加入更多的实例和案例分析，以便读者更好地理解和掌握您分享的算法知识。此外，您还可以考虑分享一些实际应用场景下的算法解决方案，这将使您的博客更加实用和有深度。再次恭喜您，并期待您的下一篇博客！谢谢您对算法学习的分享。
代码随想录算法训练营第十天 | 栈与队列理论基础，232.用栈实现队列，225. 用队列实现栈
CSDN-Ada助手: 恭喜你写完第9篇博客！标题看起来很有趣，我对栈与队列的理论基础也很感兴趣。你提到的232.用栈实现队列和225.用队列实现栈也让我想了解更多。我希望你能继续坚持创作，分享更多有趣的算法内容。如果我能提一个建议的话，我认为你可以考虑在未来的博客中加入一些实例或案例分析，这样读者不仅能够了解理论，还能更好地理解如何应用它们。期待你的下一篇博客！
代码随想录算法训练营第七天 | 454.四数相加II，383. 赎金信，15. 三数之和，18. 四数之和
CSDN-Ada助手: 恭喜博主完成第六篇博客！看到你在标题中提到的四个题目，我真的很佩服你的学习能力和坚持。通过阅读你的博客，我对这些题目有了更深入的了解。希望你能继续保持这样的创作热情，分享更多有趣且实用的算法题解。下一步的创作建议是，可以结合自己的学习过程，分享一些解题的技巧或者优化思路，这样能够更好地帮助读者理解和应用这些算法。期待你的下一篇博客！
代码随想录算法训练营第二天 | 977.有序数组的平方，209.长度最小的子数组，59.螺旋矩阵，数组总结
CSDN-Ada助手: 这是一篇很棒的博文！很高兴看到你继续分享你在代码随想录算法训练营的学习心得。你的标题很吸引人，摘要内容也很简洁明了。继续保持写作的热情和坚持，你一定会在这个领域内取得更大的进步！关于这篇博文中提到的几个题目，我想和你分享一些相关的知识和技能。除了题目中出现的算法问题，你还可以探索一些与数组操作相关的算法，比如双指针法、滑动窗口等。这些技巧在解决数组相关的问题时非常实用。另外，你也可以深入研究一下动态规划算法，在解决一些复杂的问题时可能会派上用场。希望我的建议对你有所帮助，期待看到你未来更多精彩的博文！加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。