题意:
在长度为 n n n 的原字符串 S S S 找到中出现两次或两次以上的、相互之间没有重叠的连续子字符串的最大长度。
思路:
这道题的解法其实挺多的,大家可以之后多想下,我这里就只写一个最容易想到的吧。
首先说下暴力做法,那就是先双指针寻找两个连续子串的开始位置,然后再逐个比较字符是否相同……这一套下来,差不多快 n 3 n^{3} n3 了,不 T L E TLE TLE 才怪。
题面说要求
l
e
n
len
len 的最大长度,有些眼熟,是不是可以考虑一下二分呢?
确定了连续子串的长度之后,接下来就是双指针了,这里的时间也是不能省的,这样的话时间复杂度已经
log
n
∗
n
2
\log{n}*n^{2}
logn∗n2 ,如果想过的话就只能保证两个字符串比较要在
O
(
1
)
O(1)
O(1) 内进行。那就
H
a
s
h
Hash
Hash 处理一下即可。
至于为什么要用 131 、 31 131、31 131、31 这些数呢?感兴趣的话可以自己查一下,这里就不补充了。
时间复杂度: O ( n 2 ∗ log n ) O(n^2*\log{n}) O(n2∗logn)
#include <bits/stdc++.h>
using namespace std;
#define ull unsigned long long
const int N = 5e3 + 10, M = 1e6 + 10, p = 131;
int n;
char s[N];
ull h[M], d[M];
void init() {
d[0] = 1, h[0] = 0;
for (int i = 1; i <= n; i++) {
h[i] = h[i - 1] * p + s[i] - 'a' + 1;
d[i] = d[i - 1] * p;
}
}
ull get(int l, int r) {
return h[r] - h[l - 1] * d[r - l + 1];
}
bool check(int mid) {
for (int i = 1; i <= n - mid + 1; i++) {
ull x = get(i, i + mid - 1);
for (int j = i + mid; j <= n - mid + 1; j++) {
ull y = get(j, j + mid - 1);
if (x == y)
return true;
}
}
return false;
}
int main() {
cin >> n >> s + 1;
init();
int l = 0, r = n;
while (l < r) {
int mid = l + r + 1 >> 1;
if (check(mid))
l = mid;
else
r = mid - 1;
}
cout << l;
return 0;
}