题目
题意: 给你N K,求这个串出现次数>=K的子串 可重叠。
二分答案长度,对n个后缀按字典序分组,使得每组的最长公共前缀>=mid 。判断是否存在一组里面拥有的串的个数>=K 。
下面的代码其实是错的!!真不知道那些人怎么过的。。对最后一组的处理很不好。
inline int check(int mid){//按height分组后存在一组字符串的个数>=K
for(int i=2,cnt=1;i<=n;++i){
if(h[i]>=mid&&i<n) {++cnt;continue;}
else{
if(cnt>=K) return 1;
cnt=1;
}
}
return 0;
}
#include<cstdio>
#include<algorithm>
using namespace std;
const int N=2e4+5,M=1e6+5;
int x[N],y[N],c[M],sa[N],rk[N],h[N],s[N],n,m,K;
inline void get_sa(){
for(int i=1;i<=m;++i) c[i]=0;
for(int i=1;i<=n;++i) ++c[x[i]=s[i]];
for(int i=2;i<=m;++i) c[i]+=c[i-1];
for(int i=n;i>=1;--i) sa[c[x[i]]--]=i;
for(int k=1;k<=n;k<<=1){
int num=0;
for(int i=n-k+1;i<=n;++i) y[++num]=i;
for(int i=1;i<=n;++i) if(sa[i]>k) y[++num]=sa[i]-k;
for(int i=1;i<=m;++i) c[i]=0;
for(int i=1;i<=n;++i) ++c[x[i]];
for(int i=2;i<=m;++i) c[i]+=c[i-1];
for(int i=n;i>=1;--i) sa[c[x[y[i]]]--]=y[i];
swap(x,y);
x[sa[1]]=1,num=1;
for(int i=2;i<=n;++i)
x[sa[i]]=(y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k])?num:++num;
if(num==n) break;
m=num;
}
}
inline void get_h(){
int k=0;
for(int i=1;i<=n;++i) rk[sa[i]]=i;
for(int i=1;i<=n;++i){
if(rk[i]==1) continue;
if(k) --k;
int j=sa[rk[i]-1];
while(i+k<=n&&j+k<=n&&s[i+k]==s[j+k]) ++k;
h[rk[i]]=k;
}
}
inline int check(int mid){
int cnt=1;
for(int i=1;i<=n;++i){
if(h[i]>=mid) ++cnt;
else{
if(cnt>=K) return 1;
cnt=1;
}
}
if(cnt>=K) return 1;
return 0;
}
int main(){
scanf("%d%d",&n,&K);
if(!n){puts("0");return 0;}
for(int i=1;i<=n;++i) scanf("%d",&s[i]),++s[i];
m=1e6+1,get_sa(),get_h();
int low=0,high=n,mid;
while(low<=high){
mid=(low+high)>>1;
if(check(mid)) low=mid+1;
else high=mid-1;
}
printf("%d\n",low-1);
}