28. 实现 strStr()
本题使用KMP算法进行字符串匹配的操作,KMP算法避免从头进行匹配,节省时间。
KMP算法内容
1.前缀表
在KMP算法中,数组next就是前缀表,它存放的是模式串与主串不匹配时,该回退到哪个位置,next数组时KMP算法不重头开始匹配的关键。
1.1前缀表的获得
前缀表记录下标i之前(包括i)的字符串中,有多大长度的相同前缀后缀。
前缀表为:0 1 0 1 2 0
1.2 next数组
next数组就可以是前缀表,但是很多实现都是把前缀表统一减一(右移一位,初始位置为-1)之后作为next数组。
统一减一: next:-1 0 -1 0 1 -1
右移一位: next:-1 0 1 0 1 2
前缀表: next: 0 1 0 1 2 0
使用前缀表直接构造next数组代码如下,回退的是当前位置之前的值。
void getnext(int* next,const string& s){
int j = 0;
next[0] = j;
for(int i=1;i<s.size();i++){
while(j>0&&s[i]!=s[j]){
j=next[j-1];
}
if(s[i]==s[j]){
j++;
}
next[i] = j;
}
}
1.3 字符串匹配
设置两个下标i、j分别作为字符串和模式串的起始位置,遍历判断。
int strStr(string haystack, string needle) {
if(needle.size()==0){
return 0;
}
int next[needle.size()];
getnext(next,needle);
int j =0;
for(int i=0;i<haystack.size();i++){
while(j>0&&haystack[i]!=needle[j]){
j = next[j-1];
}
if(haystack[i]==needle[j]){
j++;
}
if(j==needle.size()){
return (i-needle.size()+1);
}
}
return -1;
459.重复的子字符串
思路: 可使用KMP算法进行解题,最长相等前后缀不包含的子串就是最小重复子串,next数组求法与上一题求法相同。
视频讲解: 代码随想录_重复的子字符串
关键点: 在于数组长度减去最长相同前后缀的长度相当于是第一个周期的长度,也就是一个周期的长度,如果这个周期可以被整除,就说明整个数组就是这个周期的循环。
bool repeatedSubstringPattern(string s) {
if (s.size() == 0) {
return false;
}
int next[s.size()];
getNext(next, s);
int len = s.size();
if (next[len - 1] != 0 && len % (len - (next[len - 1] )) == 0) {
return true;
}
return false;
}