给定一个字符串,求最长重复子串,这两个子串不能重叠。
算法分析:
这题比上一题稍复杂一点。先二分答案,把题目变成判定性问题:判断是否
存在两个长度为 k 的子串是相同的,且不重叠。解决这个问题的关键还是利用height 数组。把排序后的后缀分成若干组,其中每组的后缀之间的 height 值都不小于 k。例如,字符串为“aabaaaab”,当 k=2 时,后缀分成了 4 组。
容易看出,有希望成为最长公共前缀不小于 k 的两个后缀一定在同一组。然
后对于每组后缀,只须判断每个后缀的 sa 值的最大值和最小值之差是否不小于k。如果有一组满足,则说明存在,否则不存在。整个做法的时间复杂度为
O(nlogn)。本题中利用 height 值对后缀进行分组的方法很常用,请读者认真体会。
注意:这道题和例题不一样的点在于只要是两个序列的差值相等都算相同的序列。要对原始序列初始化。cal[i]=cal[i]-cal[i-1];结果可能为负,可以整体加一个数。长度变为 4;
但要给cal[1]赋一个和其他所有数都不一样的值。
例如: 2 3 4 5 7 8 9 10 15 20
答案应该是4,算出来是5。
#include <cstdio>
#include <cstring>
#include<iostream>
#include <algorithm>
#define F(x) ((x) / 3 + ((x) % 3 == 1 ? 0 : tb))
#define G(x) ((x) < tb ? (x) * 3 + 1 : ((x) - tb) * 3 + 2)
#define ll long long
using namespace std;
const int N = 3*(1e5+5);
int wa[N], wb[N], wss[N], wv[N], sa[N];
int rak[N], height[N], cal[N],n;
char s[N],ans[N],s1[N];
int cnt[N];
int c0(int *r, int a, int b) {
return r[a] == r[b] && r[a + 1] == r[b + 1] && r[a + 2] == r[b + 2];
}
int c12(int k, int *r, int a, int b) {
if (k == 2)
return r[a] < r[b] || r[a] == r[b] && c12(1, r, a + 1, b + 1);
return r[a] < r[b] || r[a] == r[b] && wv[a + 1] < wv[b + 1];
}
void Rsort(int *r, int *a, int *b, int n, int m) {
for (int i = 0; i < n; i++) wv[i] = r[a[i]];
for (int i = 0; i < m; i++) wss[i] = 0;
for (int i = 0; i < n; i++) wss[wv[i]]++;
for (int i = 1; i < m; i++) wss[i] += wss[i - 1];
for (int i = n - 1; i >= 0; i--) b[--wss[wv[i]]] = a[i];
}
void dc3(int *r, int *sa, int n, int m) {
int i, j, *rn = r + n, *san = sa + n, ta = 0, tb = (n + 1) / 3, tbc = 0, p;
r[n] = r[n + 1] = 0;
for (i = 0; i < n; i++) if (i % 3 != 0) wa[tbc++] = i;
Rsort(r + 2, wa, wb, tbc, m);
Rsort(r + 1, wb, wa, tbc, m);
Rsort(r, wa, wb, tbc, m);
for (p = 1, rn[F(wb[0])] = 0, i = 1; i < tbc; i++)
rn[F(wb[i])] = c0(r, wb[i - 1], wb[i]) ? p - 1 : p++;
if (p < tbc) dc3(rn, san, tbc, p);
else for (i = 0; i < tbc; i++) san[rn[i]] = i;
for (i = 0; i < tbc; i++) if (san[i] < tb) wb[ta++] = san[i] * 3;
if (n % 3 == 1) wb[ta++] = n - 1;
Rsort(r, wb, wa, ta, m);
for (i = 0; i < tbc; i++) wv[wb[i] = G(san[i])] = i;
for (i = 0, j = 0, p = 0; i < ta && j < tbc; p++)
sa[p] = c12(wb[j] % 3, r, wa[i], wb[j]) ? wa[i++] : wb[j++];
for (; i < ta; p++) sa[p] = wa[i++];
for (; j < tbc; p++) sa[p] = wb[j++];
}
void calheight(int *r, int *sa, int n) {
int i, j, k = 0;
for (i = 1; i <= n; i++) rak[sa[i]] = i;
for (i = 0; i < n; height[rak[i++]] = k)
for (k ? k-- : 0, j = sa[rak[i] - 1]; r[i + k] == r[j + k]; k++);
for(int i=n;i;i--) rak[i]=rak[i-1];
for(int i=n;i;i--) sa[i]++;
}
bool check(int k)
{
int minn,maxx;minn=maxx=sa[1];
for(int i=2;i<=n;i++)
{
if(height[i]<k)
{
if(maxx-minn>=k) return 1;
minn=maxx=sa[i];
}
else
{
minn=min(minn,sa[i]);
maxx=max(maxx,sa[i]);
}
}
if(maxx-minn>=k) return 1;
return 0;
}
int main(){
while(scanf("%d",&n)&&n)
{
for(int i=1;i<=n;i++)
scanf("%d",&cal[i]);
for(int i=n;i>=1;i--)
cal[i]=cal[i]-cal[i-1]+100;
cal[n+1]=0;
cal[1]=191;
dc3(cal+1,sa,n+1,200);
calheight(cal+1,sa,n);
int l=3,r=n;
while(l<r)
{
int mid=(l+r+1)/2;
if(check(mid)) l=mid;
else r=mid-1;
}
if(l==3) printf("0\n");
else printf("%d\n",l+1);
}
}