代码随想录算法训练营第九天 | 28. 实现 strStr()，459.重复的子字符串，字符串总结，双指针回顾

今天写代码了吗123

于 2024-02-29 14:51:19 发布

阅读量545

点赞数 24

分类专栏：算法训练营文章标签：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qwerty0157/article/details/136370314

版权

算法训练营专栏收录该内容

19 篇文章 0 订阅

订阅专栏

本文详细介绍了KMP算法中的前缀表、最长公共前后缀的概念，展示了如何通过构建next数组进行字符串匹配，并探讨了如何在重复子串组成的字符串中应用KMP算法。文章还涉及时间复杂度和空间复杂度的分析。

摘要由CSDN通过智能技术生成

28. 实现 strStr()

题目：给定一个 haystack 字符串和一个 needle 字符串，在 haystack 字符串中找出 needle 字符串出现的第一个位置 (从0开始)。如果不存在，则返回 -1。

1. KMP有什么用

KMP的主要思想是当出现字符串不匹配时，可以知道一部分之前已经匹配的文本内容，可以利用这些信息避免从头再去做匹配了。

2. 什么是前缀表

前缀表是用来回退的，它记录了模式串与主串(文本串)不匹配的时候，模式串应该从哪里开始重新匹配。

前缀表的任务是当前位置匹配失败，找到之前已经匹配上的位置，再重新匹配，此也意味着在某个字符失配时，前缀表会告诉你下一步匹配中，模式串应该跳到哪个位置。

那么什么是前缀表：记录下标i之前（包括i）的字符串中，有多大长度的相同前缀后缀。

3. 最长公共前后缀

字符串的前缀是指不包含最后一个字符的所有以第一个字符开头的连续子串。

后缀是指不包含第一个字符的所有以最后一个字符结尾的连续子串。

前缀表要求的就是相同前后缀的长度。

4. 为什么一定要用前缀表

下标5之前这部分的字符串（也就是字符串aabaa）的最长相等的前缀和后缀字符串是子字符串aa ，因为找到了最长相等的前缀和后缀，匹配失败的位置是后缀子串的后面，那么我们找到与其相同的前缀的后面重新匹配就可以了。

5. 如何计算前缀表

长度为前1个字符的子串a，最长相同前后缀的长度为0。长度为前2个字符的子串aa，最长相同前后缀的长度为1。长度为前3个字符的子串aab，最长相同前后缀的长度为0。

那么把求得的最长相同前后缀的长度就是对应前缀表的元素。

可以看出模式串与前缀表对应位置的数字表示的就是：下标i之前（包括i）的字符串中，有多大长度的相同前缀后缀。

找到的不匹配的位置，那么此时我们要看它的前一个字符的前缀表的数值是多少。

为什么要前一个字符的前缀表的数值呢，因为要找前面字符串的最长相同的前缀和后缀。

所以要看前一位的前缀表的数值。

6. 前缀表与next数组

next数组就可以是前缀表，但是很多实现都是把前缀表统一减一（右移一位，初始位置为-1）之后作为next数组。

7. 使用next数组来匹配

8. 时间复杂度分析

其中n为文本串长度，m为模式串长度，因为在匹配的过程中，根据前缀表不断调整匹配的位置，可以看出匹配的过程是O(n)，之前还要单独生成next数组，时间复杂度是O(m)。所以整个KMP算法的时间复杂度是O(n+m)的。

9. 构造next数组

构造next数组其实就是计算模式串s，前缀表的过程。 主要有如下三步：

初始化：

定义两个指针i和j，j指向前缀末尾位置，i指向后缀末尾位置。然后还要对next数组进行初始化赋值。

处理前后缀不相同的情况：

因为j初始化为-1，那么i就从1开始，进行s[i] 与 s[j+1]的比较。所以遍历模式串s的循环下标i 要从 1开始。

如果 s[i] 与 s[j+1]不相同，也就是遇到前后缀末尾不相同的情况，就要向前回退。next[j]就是记录着j（包括j）之前的子串的相同前后缀的长度。那么 s[i] 与 s[j+1] 不相同，就要找 j+1前一个元素在next数组里的值（就是next[j]）。

处理前后缀相同的情况：

如果 s[i] 与 s[j + 1] 相同，那么就同时向后移动i 和j 说明找到了相同的前后缀，同时还要将j（前缀的长度）赋给next[i], 因为next[i]要记录相同前后缀的长度。

10. 使用next数组来做匹配

定义两个下标j 指向模式串起始位置，i指向文本串起始位置。那么j初始值依然为-1，为什么呢？ 依然因为next数组里记录的起始位置为-1。

i就从0开始，遍历文本串。接下来就是 s[i] 与 t[j + 1] （因为j从-1开始的）进行比较。

如果 s[i] 与 t[j + 1] 不相同，j就要从next数组里寻找下一个匹配的位置。

如果 s[i] 与 t[j + 1] 相同，那么i 和 j 同时向后移动。

如何判断在文本串s里出现了模式串t呢，如果j指向了模式串t的末尾，那么就说明模式串t完全匹配文本串s里的某个子串了。

本题要在文本串字符串中找出模式串出现的第一个位置 (从0开始)，所以返回当前在文本串匹配模式串的位置i 减去模式串的长度，就是文本串字符串中出现模式串的第一个位置。

459.重复的子字符串

题目：给定一个非空的字符串，判断它是否可以由它的一个子串重复多次构成。给定的字符串只含有小写英文字母，并且长度不超过10000。

移动匹配

当一个字符串s：abcabc，内部由重复的子串组成，那么这个字符串的结构，也就是由前后相同的子串组成。

那么既然前面有相同的子串，后面有相同的子串，用 s + s，这样组成的字符串中，后面的子串做前串，前面的子串做后串，就一定还能组成一个s。

所以判断字符串s是否由重复子串组成，只要两个s拼接在一起，里面还出现一个s的话，就说明是由重复子串组成。

当然，我们在判断 s + s 拼接的字符串里是否出现一个s的的时候，要刨除 s + s 的首字符和尾字符，这样避免在s+s中搜索出原来的s，我们要搜索的是中间拼接出来的s。

时间复杂度: O(n)

空间复杂度: O(1)

KMP

KMP算法中next数组为什么遇到字符不匹配的时候可以找到上一个匹配过的位置继续匹配，靠的是有计算好的前缀表。前缀表里，统计了各个位置为终点字符串的最长相同前后缀的长度。

在由重复子串组成的字符串中，最长相等前后缀不包含的子串就是最小重复子串。

步骤一：因为这是相等的前缀和后缀，t[0] 与 k[0]相同， t[1] 与 k[1]相同，所以 s[0] 一定和 s[2]相同，s[1] 一定和 s[3]相同，即：，s[0]s[1]与s[2]s[3]相同。

步骤二：因为在同一个字符串位置，所以 t[2] 与 k[0]相同，t[3] 与 k[1]相同。

步骤三：因为这是相等的前缀和后缀，t[2] 与 k[2]相同，t[3]与k[3] 相同，所以，s[2]一定和s[4]相同，s[3]一定和s[5]相同，即：s[2]s[3] 与 s[4]s[5]相同。

步骤四：循环往复。

字符串总结

1. 什么是字符串

在C语言中，把一个字符串存入一个数组时，也把结束符 '\0'存入数组，并以此作为该字符串是否结束的标志。string提供更多的字符串处理的相关接口，例如string 重载了+，而vector却没有。

2. 要不要使用库函数

所以建议如果题目关键的部分直接用库函数就可以解决，建议不要使用库函数。

如果库函数仅仅是解题过程中的一小部分，并且你已经很清楚这个库函数的内部实现原理的话，可以考虑使用库函数。

3. 双指针法

其实很多数组填充类的问题，都可以先预先给数组扩容带填充后的大小，然后在从后向前进行操作。

4. 反转系列

其实当需要固定规律一段一段去处理字符串的时候，要想想在在for循环的表达式上做做文章。

5. KMP

当出现字符串不匹配时，可以知道一部分之前已经匹配的文本内容，可以利用这些信息避免从头再去做匹配了。

双指针回顾

1. 数组

原地移除数组上的元素，我们说到了数组上的元素，不能真正的删除，只能覆盖。

所以此时使用双指针法才展现出效率的优势：通过两个指针在一个for循环下完成两个for循环的工作。

2. 字符串

使用双指针法，定义两个指针（也可以说是索引下标），一个从字符串前面，一个从字符串后面，两个指针同时向中间移动，并交换元素。时间复杂度是O(n)。

3. 链表

只需要改变链表的next指针的指向，直接将链表反转，而不用重新定义一个新的链表。

找到环的入口：使用快慢指针（双指针法），分别定义 fast 和 slow指针，从头结点出发，fast指针每次移动两个节点，slow指针每次移动一个节点，如果 fast 和 slow指针在途中相遇，说明这个链表有环。

4. N数之和

其实使用双指针也可以解决1.两数之和的问题，只不过1.两数之和求的是两个元素的下标，没法用双指针，如果改成求具体两个元素的数值就可以了。

今天写代码了吗123

关注

24
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

今天写代码了吗123 CSDN认证博客专家 CSDN认证企业博客

码龄3年

19: 原创

127万+: 周排名

16万+: 总排名

1万+: 访问

: 等级

575: 积分

209: 粉丝

382: 获赞

9: 评论

323: 收藏

私信

关注

热门文章

分类专栏

算法训练营 19篇

最新评论

代码随想录算法训练营第二十二天 | 235. 二叉搜索树的最近公共祖先，701.二叉搜索树中的插入操作，450.删除二叉搜索树中的节点
CSDN-Ada助手: 恭喜您在代码随想录算法训练营中坚持学习，第19篇博客内容涵盖了235、701和450三道二叉搜索树相关的算法题目，看来您对这一类题目有很好的理解和掌握。在接下来的创作中，或许可以考虑结合实际案例或者分享一些解题思路的心得体会，这样可以让读者更好地理解和运用算法知识。希望您能继续保持热情，不断学习进步，期待您更多精彩的分享！
代码随想录算法训练营第二十一天 | 530.二叉搜索树的最小绝对差，501.二叉搜索树中的众数，236. 二叉树的最近公共祖先
CSDN-Ada助手: 恭喜您在代码随想录算法训练营中坚持学习，第二十一天的学习内容看起来非常丰富和深入。对于这些经典的二叉搜索树和二叉树问题，您的总结和分享都非常有见地。不过，我也希望您在未来的博客中能够更加深入地分析算法的原理和应用场景，这样能够更好地帮助读者理解和应用这些算法。期待您的下一篇博客！
代码随想录算法训练营第十八天 | 513.找树左下角的值，112. 路径总和，106.从中序与后序遍历序列构造二叉树
CSDN-Ada助手: 恭喜您第16篇博客的问世！您对于算法训练营的学习和总结非常用心，能够将多个题目进行整合讲解，让读者能够一次性获取到多方面的知识。希望您在未来的创作中可以适当增加一些实际案例分析，或者对于某些算法的优化方法进行更深入的探讨，这样能够更好地帮助读者理解和应用相关知识。加油！期待您更多精彩的分享！
代码随想录算法训练营第十七天 | 110.平衡二叉树，257. 二叉树的所有路径，404.左叶子之和
CSDN-Ada助手: 恭喜您在算法训练营中坚持学习，第15篇博客内容丰富，涵盖了平衡二叉树、二叉树的所有路径和左叶子之和等内容，展示了您在算法学习上的不懈努力。建议您在未来的创作中，可以尝试加入一些自己的思考和总结，让读者更容易理解和吸收您的知识分享。期待您在算法学习的道路上不断进步，继续分享更多有价值的内容！
代码随想录算法训练营第十六天 | 104.二叉树的最大深度 559.n叉树的最大深度，111.二叉树的最小深度，222.完全二叉树的节点个数
CSDN-Ada助手: 恭喜用户在算法训练营中取得了不错的进展，写下了这么多有关二叉树深度和节点个数的文章！希望您能继续坚持写作，分享更多有价值的内容。下一步可以考虑拓展其他数据结构或算法题目的讨论，让读者能够更全面地了解和学习算法知识。期待您的更多精彩作品！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。