给你一个字符串 text ,请你返回满足下述条件的 不同 非空子字符串的数目:
可以写成某个字符串与其自身相连接的形式(即,可以写为 a + a,其中 a 是某个字符串)。
例如,abcabc 就是 abc 和它自身连接形成的。
示例 1:
输入:text = "abcabcabc"
输出:3
解释:3 个子字符串分别为 "abcabc","bcabca" 和 "cabcab" 。
示例 2:
输入:text = "leetcodeleetcode"
输出:2
解释:2 个子字符串为 "ee" 和 "leetcodeleetcode" 。
链接:🔗
思路: 字符串hash
1. 字符串hash就是将字符串转换成一个P进制数,用此来代表字符串
2. 一般来说P取131或者13331,此时Hash值产生冲突的概率极低
3. 而对于hash求出的结果值一般保存为unsigned long long 这样可以利用C++的自然溢出
4. 'abcdef' 要算子串'de'的hash值, hash('abcde') - hash('abc') * pow(2) // pow(2)代表是P进制下的P^2
class Solution {
public:
typedef unsigned long long ULL;
int base = 131;
set<ULL> s;
vector<ULL> h;
vector<ULL> power;
ULL gethash(int st,int len){
return h[st + len - 1] - h[st - 1] * power[len];
}
int distinctEchoSubstrings(string text) {
int n = text.size();
h.resize(n + 1);
power.resize(n + 1);
h[0] = 0;
power[0] = 1;
for (int i = 1; i <= n; ++i){
h[i] = h[i - 1] * base + text[i - 1] - 'a' + 1;
power[i] = power[i - 1] * base;
}
for (int len = 2; len <= n; len += 2)
for (int i = 1; i <= n - len + 1; ++i){ // i代表的是长度为len的子串的起点位置
ULL t1 = gethash(i,len/2);
ULL t2 = gethash(i + len/2,len/2);
if (t1 == t2){
s.insert(t1);
}
}
return s.size();
}
};