题意:
给定长度为n的数组a,
要求计算出现至少 k 次的子串的最大长度
数据范围:n<=2e4,a(i)<=1e6
解法:
对数组a构造后缀数组,
后缀数组height的定义:
排名相邻的后缀的最长公共前缀
因为每个子串一定是某个后缀的前缀,前缀相同的一定相邻,
那么出现至少k次就意味着后缀排序后有至少连续k个后缀的LCP是这个子串。
那么计算height数组中所有长度为k-1的子段的最小值,对他们取max就是答案。
所有长度为k-1的子段最小值,是经典的滑动窗口题,可以用单调队列解决。
因此对height数组滑动窗口一下就行了。
ps:
单调队列是O(n)的,
如果要求不是那么高的话,可以写O(nlogn)的multiset,更好写一点。
具体操作是插入相邻的k-1个height,取min是set的基本操作
当size>=k的时候,删掉multiset中的height[i-k+1]就行了。
(其实就是用multiset实现尺取)
code:
#include<bits/stdc++.h>
using namespace std;
const int maxm=1e5+5;
struct SA{
static const int N=4e6+5;
// char s[N];
int s[N];
int sa[N],rk[N],oldrk[N<<1],id[N],px[N],cnt[N];
int ht[N];
int n;//字符串长度
int m=300;//初始字符集大小
bool cmp(int x,int y,int w){
return oldrk[x]==oldrk[y]&&oldrk[x+w]==oldrk[y+w];
}
void getSA(){
int i,p,w;
for(i=1;i<=n;i++)cnt[rk[i]=s[i]]++;
for(i=1;i<=m;i++)cnt[i]+=cnt[i-1];
for(i=n;i>=1;i--)sa[cnt[rk[i]]--]=i;
//
for(w=1;w<n;w<<=1,m=p){
for(p=0,i=n;i>n-w;i--)id[++p]=i;
for(i=1;i<=n;i++)if(sa[i]>w)id[++p]=sa[i]-w;
memset(cnt,0,sizeof cnt);
for(i=1;i<=n;i++)cnt[px[i]=rk[id[i]]]++;
for(i=1;i<=m;i++)cnt[i]+=cnt[i-1];
for(i=n;i>=1;i--)sa[cnt[px[i]]--]=id[i];
memcpy(oldrk,rk,sizeof rk);
for(p=0,i=1;i<=n;i++){
rk[sa[i]]=cmp(sa[i],sa[i-1],w)?p:++p;
}
}
//
// for(int i=1;i<=n;i++)printf("%d ",sa[i]);
// puts("");
}
void getHT(){
for(int i=1,k=0;i<=n;i++){
if(k)k--;
while(s[i+k]==s[sa[rk[i]-1]+k])k++;
ht[rk[i]]=k;
}
}
}sa;
signed main(){
int n,k;scanf("%d%d",&n,&k);
for(int i=1;i<=n;i++)scanf("%d",&sa.s[i]);
sa.n=n;
sa.m=1e6;
sa.getSA();
sa.getHT();
deque<int>q;
int ans=0;
for(int i=2;i<=n;i++){
while(!q.empty()&&q.front()<=i-k+1)q.pop_front();//去掉越界的
while(!q.empty()&&sa.ht[q.back()]>=sa.ht[i])q.pop_back();//去掉非最小值
q.push_back(i);
if(i>=k){
ans=max(ans,sa.ht[q.front()]);
}
}
printf("%d\n",ans);
return 0;
}