把排序后的后缀分成若干组,其中每组的后缀之间的height 值都
不小于k。例如,字符串为“aabaaaab”,当k=2 时,后缀分成了4 组,如图5所示。
。然
后对于每组后缀,只须判断每个后缀的sa 值的最大值和最小值之差是否不小于
k。如果有一组满足,则说明存在,否则不存在。整个做法的时间复杂度为
O(nlogn)。
- //最长重复不重叠子串
- #include <iostream>
- #include <string>
- #include <cmath>
- #include <map>
- using namespace std;
- const int N=30000;
- int wa[N],wb[N],wv[N],wsum[N];
- int height[N],sa[N],rank[N];
- int n;
- int str[N];
- int cmp(int *r,int a,int b,int l)
- {
- return r[a]==r[b] && r[a+l]==r[b+l];
- }
- void da(int *r,int *sa,int n,int m)
- {
- int i,j,p,*x=wa,*y=wb,*t;
- for(i=0;i<m;i++)
- wsum[i]=0;
- for(i=0;i<n;i++)
- wsum[x[i]=r[i]]++;
- for(i=1;i<m;i++)
- wsum[i]+=wsum[i-1];
- for(i=n-1;i>=0;i--)
- sa[--wsum[x[i]]]=i;
- for(j=1,p=1;p<n;j*=2,m=p)
- {
- for(p=0,i=n-j;i<n;i++)
- y[p++]=i;
- for(i=0;i<n;i++)
- if(sa[i]>=j)
- y[p++]=sa[i]-j;
- for(i=0;i<n;i++)
- wv[i]=x[y[i]];
- for(i=0;i<m;i++)
- wsum[i]=0;
- for(i=0;i<n;i++)
- wsum[wv[i]]++;
- for(i=1;i<m;i++)
- wsum[i]+=wsum[i-1];
- for(i=n-1;i>=0;i--)
- sa[--wsum[wv[i]]]=y[i];
- for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
- x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
- }
- }
- void calheight(int *r,int *sa,int n)
- {
- int i,j,k=0;
- for(i=0;i<=n;i++)
- rank[sa[i]]=i;
- for(i=0;i<n;height[rank[i++]]=k)
- for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);
- }
- bool check(int x)
- {
- int i;
- int mmin=N,mmax=0;
- for(i=2;i<=n;i++)
- {
- if(height[i]>=x)
- {
- mmin=sa[i]<mmin?sa[i]:mmin;
- mmax=sa[i]>mmax?sa[i]:mmax;
- if(mmax-mmin>=x)
- return 1;
- }
- else
- {
- mmin=mmax=sa[i];
- }
- }
- return 0;
- }
- int main()
- {
- int i,j,k,l,r,mid;
- int ans;
- while(~scanf("%d",&n) && n)
- {
- for(i=0;i<n;i++)
- scanf("%d",&str[i]);
- for(i=n-1;i>0;i--)
- str[i]=str[i]-str[i-1]+90;
- str[n]=0;
- str[0]=199;
- da(str,sa,n+1,200);
- calheight(str,sa,n);
- ans=0;
- l=1;
- r=n/2;
- ans=0;
- while(l<=r)
- {
- mid=(l+r)>>1;
- if(check(mid))
- {
- ans=mid;
- l=mid+1;
- }
- else
- {
- r=mid-1;
- }
- }
- ans++;
- if(ans<5)
- ans=0;
- printf("%d\n",ans);
- }
- return 0;
- }