思路:这道题其实考察的就是寻找子串。寻找子串,我们当然可以使用暴力的解法,用两层for循环去解答,时间复杂度是O(m*n)m是模式串的长度,n是文本串的长度。但是这样就不是这道题所要考察的地方,这道题想要考察的地方是KMP算法,KMP算法相较于暴力算法,它拥有更低的时间复杂度,他的时间复杂度是O(m+n),空间复杂度是O(m),因为需要额外申请一个next数组,存放最长相同前后缀的长度。然后利用next数组去帮助我们解决这个问题。
求next数组主要分为四步。1,初始化。2,前后缀不相同的情况。3,前后缀相同的情况。4,赋值next数组。第一步,初始化,我们需要几个变量i,j。i来代表后缀的下标,j是前缀的下标。我们开始赋值next[0]=0,然后我们让i=1,开始进入for循环,来循环遍历模式串,不让i=0是因为next[0]已经赋值过了,是0。第二步就是前后缀不同的情况,前后缀不同的话,我们就需要回退前缀,回退到前一个下标对应的next值,即j=next[j-1]。第三步就是前后缀相同的情况,相同的话,就需要让前缀的下标往前移,就是让j++。第四步就是对next数组赋值,因为数组下标从0开始,所以对应的最长相同前后缀的长度就是j,next数组就是j的值,代码就是next[i]=j,
求完next数组后,我们接下来就要用next数组来判断模式串是否在文本串中了,如果在的话,就要返回模式串开头在文本串当中的下标位置,要是有多个模式串,就返回第一个模式串的下标。不在的话就返回-1。我们用一个for循环来遍历文本串,循环变量是i,循环里边,我们用一个j来代表模式串的下标,要是haystack[i]!=needle[j]且j>0的话就应该回退j,j=next[j-1]。一直回退到相等或者模式串开头,之后要是haystack[i]==needle[j]的话,我们就让j++。在之后,我们在检查j的大小,要是j的大小等于needle的长度的话,就说明找到了这样一个符合要求的子串,我们就应该返回一个下标了,这个下标就应该是i-j+1。
下面是力扣上的代码:
void getnext(int *next,string s)
{
//初始化
next[0]=0;
int i,j,k;
j=0;
//j前缀i后缀
for(i=1;i<s.size();i++)
{
//前后缀不同,就回退j
while(j>0&&s[i]!=s[j])
{
j=next[j-1];
}
//前后缀相同的话,前缀++
if(s[i]==s[j])
{
j++;
}
//赋值next[i]
next[i]=j;
}
}
int strStr(string haystack, string needle)
{
if(needle.size()==0)
{
return 0;
}
vector<int>next(needle.size());
getnext(&next[0],needle);
int i,j,k;
j=0;
for(i=0;i<haystack.size();i++)
{
while(j>0&&haystack[i]!=needle[j])
{
j=next[j-1];
}
if(haystack[i]==needle[j])
{
j++;
}
if(j==needle.size())
{
return(i-needle.size()+1);
}
}
return -1;
}