28. 实现 strStr()(題目链接:力扣)
思路:典型的kmp算法题,由于很久没接触了,基本忘得一干二净,从头到尾重新学习了一遍kmp算法,再次透彻的理解,核心思想就是当匹配到某个字符不相等时,不能直接从头开始重新匹配,这样时间复杂度太大。应该从已经匹配过了的字符串中找子字符串,怎样找重新匹配的子字符串的的位置呢,这就涉及到next数组了。这里有个最长相等前后缀字符串的说法,构造next数组时,每次将后缀字符串的尾部和前缀字符串的尾部比较,得到next[i]的值,由于i是一直遍历到str.size()的,当for循环结束,就能够得到整个next数组了。得到next数组后,就将源字符串和目标字符串进行匹配就ok了。(补充,求next数组的时候,可以看作是每次将j子串(所以用到了j串的最长公共前后缀即每次匹配不成功j=next[j-1])和i大串进行匹配——对应了将目标串和源串进行匹配)
void getNext(int* next, const string& s){
int j=0;
int size = s.size();
next[0] = 0;
for(int i=1; i<size; i++){
while(j > 0 && s[i] != s[j]){
j = next[j-1];
}
if(s[i] == s[j]){
j++;
}
next[i] = j;
}
}
int strStr(string haystack, string needle){
int needleSize = needle.size();
int next[needleSize];
getNext(next, needle);
int haystackSize = haystack.size();
int j = 0;
for(int i=0; i<haystackSize; i++){
while(j > 0 && haystack[i] != needle[j]){
j = next[j-1];
}
if(haystack[i] == needle[j]){
j++;
if(j == needleSize){
return i - needleSize + 1;
}
}
}
return -1;
}
459.重复的子字符串(题目链接:力扣)
思路:虽然看了提示说要用kmp做,但还是没想出方法(哭死),后来看了卡哥解析才知道怎么做。先求出字符串的next数组,然后直接拿数组长度减去next[size-1],如果得到的差能够将size整除,说明该字符串是由子字符串重复得来的。这点需要自己想一想,想不通的可以看卡哥解析。(补充:复习发现很容易漏掉对越界条件的判断,具体表现在判断s[i]不为空的时候一直往后的读,忽略了可能超出数组长度。不能但看外层for循环中的i<size条件,内部while循环也要加上该条件。正如上题中j=next[j-1]之前要判断j>0)
void getNext(int* next, const string& s){
int size = s.size();
int j=0;
next[0] = 0;
for(int i=1; i<size; i++){
while(j > 0 && s[i] != s[j]){
j = next[j-1];
}
if(s[i] == s[j]){
j++;
}
next[i] = j;
}
}
bool repeatedSubstringPattern(string s) {
int size = s.size();
if(size == 1) return false;
int next[size];
getNext(next, s);
int maxEqualLen = next[size - 1];
if(size % (size - maxEqualLen) == 0) return true;
return false;
}