本文参考代码随想录
给定一个非空的字符串,判断它是否可以由它的一个子串重复多次构成。给定的字符串只含有小写英文字母,并且长度不超过10000。
移动匹配
满足条件的字符串一定由前后相同的子串组成,因此如果用后面的子串做前串。前面的子串做后串,组成的字符串一定和原字符串一样。
因此,只需要将两个s拼接在一起,如果中间还有一个s的话,就说明是由重复的字符串组成。
在搜索s+s中是否出现s时,要刨除s+s的首字符和尾字符,确保搜索出来的是中间的s。
class Solution {
public:
bool repeatedSubstringPattern(string s) {
string t = s + s;
t.erase(t.begin());t.erase(t.end() - 1);
if(t.find(s) != std::string::npos){
return true;
}
return false;
}
};
时间复杂度O(n);
空间复杂度O(1);
KMP算法
在本题中,最长公共前后缀不包含的子串就是最小重复子串。
假设字符串s使用多个重复子串构成,重复出现的子字符串长度是x,所以s = n * x。
因为字符串s的最长相同前后缀的长度一定是不包含s本身,所以 最长相同前后缀长度必然是m * x,而且 n - m = 1,
所以如果 nx % (n - m)x = 0,就可以判定有重复出现的子字符串。
next 数组记录的就是最长相同前后缀 ,如果 next[len - 1] != -1,则说明字符串有最长相同的前后缀
如果len % (len - (next[len - 1] + 1)) == 0 ,则说明数组的长度正好可以被 (数组长度-最长相等前后缀的长度) 整除 ,说明该字符串有重复的子字符串。
class Solution {
public:
void getNext(int* next, const string& s) {
next[0] = -1;
int j = -1;
for(int i = 1;i < s.size();i++){
while(j >= 0 && s[i] != s[j + 1]){
j = next[j];
}
if(s[i] == s[j + 1]){
j++;
}
next[i] = j;
}
}
bool repeatedSubstringPattern(string s){
if(s.size() == 0){
return false;
}
int next[s.size()];
getNext(next, s);
int len = s.size();
if(next[len - 1] != -1 && len % (len - (next[len - 1] + 1)) == 0){
return true;
}
return false;
}
};
时间复杂度、空间复杂度为O(n)