题意:有N(1 <= N <=20000)个音符的序列来表示一首乐曲,每个音符都是1..88范围内的整数,现在要找一个重复的子串。满足
1.长度至少为5个音符。
2.在乐曲中重复出现。(可能经过转调,“转调”的意思是主题序列中每个音符都被加上或减去了同一个整数值)
3.重复出现的同一主题不能有公共部分。
思路:用后缀数组求出height后,二分答案len,判断height>=len的连续区间内sa最大和最小的差距是否大于等于len
//#include<bits/stdc++.h>
#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
const int maxn=200010;
int t1[maxn],t2[maxn],c[maxn];
bool cmp(int *r,int a,int b,int l)
{
return r[a]==r[b]&&r[a+l]==r[b+l];
}
void da(int str[],int sa[],int ra[],int height[],int n,int m)
{
n++;
int p,*x=t1,*y=t2;
for(int i=0;i<m;i++) c[i]=0;
for(int i=0;i<n;i++) c[x[i]=str[i]]++;
for(int i=1;i<m;i++) c[i]+=c[i-1];
for(int i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
for(int j=1;j<=n;j<<=1)
{
p=0;
for(int i=n-j;i<n;i++) y[p++]=i;
for(int i=0;i<n;i++)
if(sa[i]>=j) y[p++]=sa[i]-j;
for(int i=0;i<m;i++) c[i]=0;
for(int i=0;i<n;i++) c[x[y[i]]]++;
for(int i=1;i<m;i++) c[i]+=c[i-1];
for(int i=n-1;i>=0;i--) sa[--c[x[y[i]]]]=y[i];
swap(x,y);
p=1;x[sa[0]]=0;
for(int i=1;i<n;i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
if(p>=n) break;
m=p;
}
int k=0;
n--;
for(int i=0;i<=n;i++) ra[sa[i]]=i;
for(int i=0;i<n;i++)
{
if(k) k--;
int j=sa[ra[i]-1];
while(str[i+k]==str[j+k])k++;
height[ra[i]]=k;
}
}
int m,n,k,t;
int ra[maxn],height[maxn],str[maxn],sa[maxn],a[maxn];
char s[maxn];
int check(int len)
{
int i=2;
while(i<n)
{
if(height[i]>=len)
{
int j=i,mi=sa[i-1],ma=sa[i-1];
while(j<n&&height[j]>=len)
{
mi=min(sa[j],mi);
ma=max(sa[j],ma);
j++;
}
i=j;
if(ma-mi>=len)
return 1;
}
else i++;
}
return 0;
}
int main()
{
//freopen("in.txt","r",stdin);
while(~scanf("%d",&n))
{
if(n==0)break;
memset(str,0,sizeof str);
for(int i=0;i<n;i++)
{
scanf("%d",&a[i]);
}
for(int i=1;i<n;i++)
str[i-1]=a[i]-a[i-1]+100;
n--;
da(str,sa,ra,height,n,200);
int l=4,r=n,ans=0;
while(l<=r)
{
int mid=(l+r)>>1;
if(check(mid))
{
ans=mid;
l=mid+1;
}
else r=mid-1;
}
if(ans>=4) ans++;
else ans=0;
printf("%d\n",ans);
}
return 0;
}