题目链接:459. 重复的子字符串
题目:
给定一个非空的字符串 s ,检查是否可以通过由它的一个子串重复多次构成。
示例 1:
输入: s = “abab”
输出: true
解释: 可由子串 “ab” 重复两次构成。
示例 2:
输入: s = “aba”
输出: false
示例 3:
输入: s = “abcabcabcabc”
输出: true
解释: 可由子串 “abc” 重复四次构成。 (或子串 “abcabc” 重复两次构成。)
提示:
- 1 <= s.length <= 104
- s 由小写英文字母组成
思路和算法:
我们在字符串:28. 实现strStr() 里提到了,在一个串中查找是否出现过另一个串,这是KMP的看家本领。那么寻找重复子串怎么也涉及到KMP算法了呢?
这里就要说一说next数组了,next 数组记录的就是最长相等前后缀, 如果 next[len - 1] != -1,则说明字符串有最长相等的前后缀。最长相等前后缀的长度为:next[len - 1] + 1。(这里的next数组是以统一减一的方式计算的,因此需要+1。)假设数组长度为len,如果len % (len - (next[len - 1] + 1)) == 0 ,则说明 (数组长度-最长相等前后缀的长度) 正好可以被数组的长度整除,说明有该字符串有重复的子字符串。
数组长度减去最长相同前后缀的长度相当于是第一个周期的长度,也就是一个周期的长度,如果这个周期可以被整除,就说明整个数组就是这个周期的循环。建议大家把next数组打印出来,看看next数组里的规律,有助于理解KMP算法。
next[len - 1] = 7,next[len - 1] + 1 = 8,8就是此时字符串asdfasdfasdf的最长相等前后缀的长度。(len - (next[len - 1] + 1)) 也就是: 12(字符串的长度) - 8(最长相等前后缀的长度) = 4, 4正好可以被 12(字符串的长度) 整除,所以说明有重复的子字符串(asdf)。
代码(c++):
//KMP算法
//前缀统一减一
class Solution {
public:
//构建next数组
void getNext(vector<int>& next, string& s) {
int j = -1; //j指向前缀末尾
next[0] = j; //next[i]表示i之前(包括i)的最长相等前后缀长度(其实就是j)
for (int i = 1; i < s.size(); ++i) { //i指向后缀末尾,注意i的初始值为1
while (j >= 0 && s[i] != s[j + 1]) { //前后缀不同
j = next[j]; //向前回退
}
if (s[i] == s[j + 1]) { //前后缀相同
j++;
}
next[i] = j; //将j(前缀的长度)赋值给next[i]
}
}
bool repeatedSubstringPattern(string s) {
if (!s.size()) return false;
vector<int> next(s.size()); //定义next数组
getNext(next, s);
int len = s.size();
if (next[len - 1] != -1 && len % (len - (next[len - 1] + 1)) == 0)
return true;
return false;
}
};
思路还是来自于卡哥,这个KMP一时之间属实不是很明白,害,加油!