给定一个字符串,求至少出现 k 次的最长重复子串,这 k 个子串可以重叠。
算法分析:
这题的做法和上一题差不多,也是先二分答案,然后将后缀分成若干组。不同的是,这里要判断的是有没有一个组的后缀个数不小于 k。如果有,那么存在k 个相同的子串满足条件,否则不存在。这个做法的时间复杂度为 O(nlogn)
#include<cstdio>
#include<iostream>
#include<cstring>
using namespace std;
const int maxn=20010;
int a[maxn],b[maxn],s[maxn],c[maxn];
int *rank,*height,*sa=s+1;
void sortandrank(int *a1,int *a2,int n,int &m,int j)
{
int i;memset(c,0,sizeof(c));
for(i=0;i<n;i++) c[a1[i]]++;
for(i=1;i<=m;i++) c[i]+=c[i-1];
for(i=n-1;i>=0;i--) sa[--c[a1[a2[i]]]]=a2[i];
a2[sa[0]]=m=0;
for(i=1;i<n;i++) a2[sa[i]]=a1[sa[i-1]]==a1[sa[i]]&&a1[sa[i-1]+j]==a1[sa[i]+j]?m:++m;
}
void da(int*str,int n,int m)
{
int *a1=a,*a2=b,*tmp;
int i,j,p;
for(i=0;i<n;i++) a1[i]=i,a2[i]=str[i];
a1[n]=a2[n]=-1;
sortandrank(a2,a1,n,m,0);
for(j=1;m<n-1;j<<=1)
{
p=0;
for(i=n-j;i<n;i++) a2[p++]=i;
for(i=0;i<n;i++) if(sa[i]>=j) a2[p++]=sa[i]-j;
sortandrank(a1,a2,n,m,j);
tmp=a1,a1=a2,a2=tmp;
}
rank=a1,height=a2;
}
void calheight(int*str,int n)
{
int i,j,k;
sa[-1]=n;
for(height[0]=k=i=0;i<n;i++)
{
for(k?k--:0,j=sa[rank[i]-1];str[i+k]==str[j+k];k++);
height[rank[i]]=k;
}
}
int hash[1000005],num[maxn],m=1;
bool chk(int mid,int n,int k)
{
int cnt=0;
for(int i=2;i<=n;i++)
{
if(height[i]<mid) cnt=0;
else cnt++;
if(cnt>=k) return 1;
}
return 0;
}
int main()
{
int n,k,x;
//memset(hash,-1,sizeof(hash));
scanf("%d%d",&n,&k);
for(int i=0;i<n;i++)
{
scanf("%d",&x);
if(hash[x]==0) hash[x]=m++;
num[i]=hash[x];
}
da(num,n+1,m);calheight(num,n);
//for(int i=0;i<=n;i++) cout<<height[i]<<' '<<sa[i]<<endl;
int l=0,r=n,mid,ans=0;
while(l<=r)
{
mid=(l+r)>>1;
if(chk(mid,n,k-1)) l=mid+1,ans=mid;
else r=mid-1;
}
printf("%d\n",ans);
return 0;
}