28. 实现 strStr()
题目链接:力扣题目链接
文章链接:代码随想录 (programmercarl.com)
视频链接1:帮你把KMP算法学个通透!B站(理论篇)
视频链接2:帮你把KMP算法学个通透!(求next数组代码篇)
这道题,我的第一想法就是两层遍历,暴力解法,但是时间复杂度较高,因为每一次匹配到不一样的元素,指向needle的指针都需要从头开始遍历,较为繁琐。
通过学习,知道了这道题还可以使用KMP算法来解决。
首先,我们需要知道什么是KMP算法,它与暴力的两层循环遍历有什么区别。
KMP算法简单的来说就是两个指针分别指向haystack和needle,依次循环遍历,如果不相等,指向needle的指针不会从头开始,而是指向一个固定的下标。这样就能减少部分遍历所花费的时间,而如何指向一个固定的下标,就需要用到前缀表next。
前缀表里的元素,是以指针指向的元素为结尾所形成的子串中,最大前后缀相同子串的元素个数。比如指针指向下标4,字串为aabaa
它的前缀有a,aa,aab,aaba(前缀必须包含最前面的一个元素,这里是a,一定没有最后的元素)
后缀有a,aa,baa,abaa(后缀必须包含最后面的元素,这里是a,一定没有最前面的元素)
最大前后缀相同的子串是aa,所以next[4]=2;
我们可以发现一个非常神奇同时非常重要的性质,任意一个字符串假定它的最大前后缀相同子串个数为n,那么这个子串从0到n-1所形成的子串和最后一个元素与它之前n-1个元素所形成子串是相等的!!!
比如子串abababab,最大前后缀相同子串个数为4,最前面4个数为abab,最后面四个数也是abab
这个性质是我们了解KMP算法的关键点!
例如:(借用知乎用户“海纳”的图)
当i与j处不匹配时,同时也说明了i-1处与j-1处是匹配的,通过知道j-1处的最大前后缀相同子串个数n,从而知道i-n到i-1所形成的子串与j-n到j-1所形成的子串相等,又因为刚刚所讲性质,j-n到j-1处所形成的子串与0到n-1处所形成的子串相等,所以j又可以移动到next(j-1)处,然后i与j继续匹配重复上述操作。(重点!!!)
那剩下的问题就是如何通过一个字符串写出它的前缀表(next数组)呢?
求next数组的过程完全也可以看成字符串匹配的过程,将两个相同的needle字符串错开一位进行匹配,一旦字符串匹配成功,那么当前的next值就是匹配成功的字符串的长度。
如图:(借用知乎用户(海纳)的图)
代码如下:
void getnext(int* next,string s)
{
int j=0;
next[0]=0;
for(int i=1;i<s.size();i++)
{
while(j>0&&s[j]!=s[i])
{
j=next[j-1];
}
if(s[j]==s[i])
{
j++;
}
next[i]=j;
}
}
总代码如下:
class Solution {
public:
void getnext(int* next,string s)//将建立前缀表的过程也看成两个相同的字符串错位匹配的过程
{
int j=0;
next[0]=0;
for(int i=1;i<s.size();i++)
{
while(j>0&&s[j]!=s[i])
{
j=next[j-1];
}
if(s[j]==s[i])
{
j++;
}
next[i]=j;
}
}
int strStr(string haystack, string needle) {
int next[needle.size()];
getnext(next,needle);//建立前缀表
int j=0;
for(int i=0;i<haystack.size();i++)
{
while(j>0&&haystack[i]!=needle[j])
{
j=next[j-1];
}
if(haystack[i]==needle[j])
{
j++;
}
if(j==needle.size())//如果j指向needle的最后一个元素'\0'了,说明前面全部匹配,直接返回起点坐标
{
return i-needle.size()+1;
}
}
return -1;
}
};
这道题就花了我5.5小时,纯纯大怨种。
KMP算法使用条件:在一个串中查找是否出现过另一个串,所以这道题找能构成字符串的子串也可以使用KMP算法。
(借用一下卡哥的图)
由图可得:t[0]=k[0],t[1]=k[1],
又因为k[0]=t[2],k[1]=t[3],
所以t[0]=t[2],t[1]=t[3],
所以t[0]t[1]=t[2]t[3]。
所以当一个字符串由重复子串组成的,最长相等前后缀不包含的子串就是最小重复子串。
代码如下:
class Solution {
public:
void getnext(string s,int* next)
{
int j=0;
next[0]=0;
for(int i=1;i<s.size();i++)
{
while(j>0&&s[j]!=s[i])
{
j=next[j-1];
}
if(s[j]==s[i])
{
j++;
}
next[i]=j;
}
}
bool repeatedSubstringPattern(string s) {
int len=s.size();
int next[len];
getnext(s,next);
if (next[len - 1] != 0 && len % (len - (next[len - 1] )) == 0)//只要总长能整除剩余子串长度,则代表有最小重复子串
{
return true;
}
return false;
}
};
字符串总结
文章链接:代码随想录 (programmercarl.com)
双指针法
文章链接:代码随想录 (programmercarl.com)
一刷KMP算法,较难理解,花了一个下午5个多小时软磨硬泡总算有个一知半解,再接再厉!