解题思路
1.题目描述
实现 strStr() 函数。
给你两个字符串 haystack 和 needle ,请你在 haystack 字符串中找出 needle 字符串出现的第一个位置(下标从 0 开始)。如果不存在,则返回 -1 。
示例1:
输入:haystack = “hello”, needle = “ll”
输出:2
示例2:
输入:haystack = “aaaaa”, needle = “bba”
输出:-1
示例3:
输入:haystack = “”, needle = “”
输出:0
来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/implement-strstr
2.题目分析
2.1 库函数
因为string自带了字符串查找函数find,所以我们可以直接调用。形式如下
haystack.find(needle);
2.2 穷举
也就是老老实实逐个字符进行比较,以长字符串haystack
为外层循环,needle
字符串为内层循环,在haystack
的每个位置查看是否此位置开始的子串等于needle
。如果等于则返回当前位置,否则继续遍历,直到未找到退出循环。
2.3 kmp算法
2.3.1 KMP算法介绍
首先,对于kmp算法的描述我在网上查找了一些,大多都比较繁琐,个人认为这一篇文章写得很清晰明了,下面贴出链接
https://blog.sengxian.com/algorithms/kmp
虽然上面的文章已经讲得很清楚了,但是为了自我巩固还是在做一个小总结。
跟其他大多数算法一样,kmp算法也是在穷举法的基础上进行优化的出来的,它与动态规划的思想如出一辙,都是尽可能的减少重复的求值。我们可以得出穷举法的复杂度达到O(MN),也算是n2级别的算法复杂度,这主要的原因就是每次当子串不匹配时我们都要对子串进行从头开始匹配,这就浪费了一些时间。有人就想到运用子串的规律来减少匹配的回退步骤。
还是以经典的字符串匹配例子来做一个假设,假设要在字符串str1=abaacaba
中查找子串str2=ababa
,我们不可避免地会遇到下面这种情况
按照穷举的思路,此时匹配失败,我们要同时对长串指针i
和子串指针j
进行回退,也就是说我们此时会回退到下面的这种状态,此时重新对i=2和j=1进行比较。反反复复直到匹配成功。
过程确实很耗时,那么如何利用子串的规律进行减少回退呢?我们这里回忆一下前缀和后缀两个概念,对于字符串aba
,它的前缀就有a,ab
,后缀就有b,ba
。我们是不是突然有一点思路了,没错,就是利用前后缀相等的情况进行字符串指针回退的步数减少。
前缀是指除最后一个字符以外的,字符串的所有头部子串
后缀是指除最前面一个字符以外的,字符串的所有尾部子串
我们来看上面提到的匹配状态