题意 :给定一个字符串 , 求至少出现k次的最长重复子串 , 这k个子串可以重叠
思路 :首先二分子串长度 L , 将问题转化成判定性问题 。判断是否有长度为L子串出现超过k次,只要根据height是否小于L将height数组进行分组 , 统计每组中后缀的个数,判断是否有一组的后缀个数大于等于k即可。
#include <stdio.h>
#include <string.h>
#include <algorithm>
using namespace std;
#define maxn 20005
#define maxm 1000005
int wa[maxn],wb[maxn],wv[maxn],ws[maxm];
int cmp(int *r,int a,int b,int l)
{return r[a]==r[b]&&r[a+l]==r[b+l];}
void da(int *r,int *sa,int n,int m){
int i,j,p,*x=wa,*y=wb,*t;
for(i=0;i<m;i++) ws[i]=0;
for(i=0;i<n;i++) ws[x[i]=r[i]]++;
for(i=1;i<m;i++) ws[i]+=ws[i-1];
for(i=n-1;i>=0;i--) sa[--ws[x[i]]]=i;
for(j=1,p=1;p<n;j*=2,m=p){
for(p=0,i=n-j;i<n;i++) y[p++]=i;
for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
for(i=0;i<n;i++) wv[i]=x[y[i]];
for(i=0;i<m;i++) ws[i]=0;
for(i=0;i<n;i++) ws[wv[i]]++;
for(i=1;i<m;i++) ws[i]+=ws[i-1];
for(i=n-1;i>=0;i--) sa[--ws[wv[i]]]=y[i];
for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
}
}
int Rank[maxn],height[maxn];
void calheight(int *r,int *sa,int n){
int i , j , k = 0 ;
for( i=1 ; i<=n ; i++ ) Rank[sa[i]]=i;
for(i=0;i<n;i++) {
if(k)k--;
int j = sa[Rank[i]-1];
while(r[i+k]==r[j+k]) k++ ;
height[Rank[i]] = k ;
}
return;
}
int r[maxn] , sa[maxn] ;
int a[maxn] ;
int n , k ;
bool check( int l , int n ) {
int time = 0 ;
int cnt = 0 ;
for( int i = 2 ; i <= n ; i ++ ) {
if( height[i] < l ) {
time = max( time , cnt == 0 ? 0 : cnt + 1 ) ;
cnt = 0 ;
} else {
cnt ++ ;
}
if( time >= k ) return true ;
}
time = max( time , cnt == 0 ? 0 : cnt + 1 ) ;
return time >= k ;
}
int main(){
while( scanf( "%d%d" , &n , &k ) != EOF ) {
int Max = 0 ;
for( int i = 0 ; i < n ;i ++ ) {
scanf( "%d" , &a[i] ) ;
a[i] ++ ;
Max = max( Max , a[i] ) ;
}
a[n] = 0 ;
da( a , sa , n + 1 , Max + 1 ) ;
calheight( a , sa , n ) ;
int l = 1 , r = n ;
int mid ;
while( l < r ) {
mid = ( l + r + 1 ) >> 1 ;
if( check( mid , n ) ) {
l = mid ;
} else {
r = mid - 1 ;
}
}
printf( "%d\n" , l ) ;
}
return 0 ;
}