题意:给出一个串,求重复次数大于等于k的最长字串的长度。
题解:对于给出的串,我们跑一次后缀数组,得出相应的三个数组,其中height[i]表示排名为i的后缀与排名为i-1的后缀的最长公共前缀的长度。
我们二分答案,对于每一个二分的长度len,若有height[i]>=len的个数大于等于k个表示该长度符合要求。
#include <cstdio>
#include <string.h>
#define maxn 2020100
#include <iostream>
using namespace std;
int wwa[maxn],wwb[maxn],wwv[maxn],wws[maxn];
//比较函数
int cmp(int *r,int a,int b,int l){
return r[a]==r[b]&&r[a+l]==r[b+l];
}
//倍增算法
void da(int *r,int *sufix,int n,int m){
int i,j,p,*x=wwa,*y=wwb,*t;
for(i=0;i<m;i++) wws[i]=0;
for(i=0;i<n;i++) wws[x[i]=r[i]]++;
for(i=1;i<m;i++) wws[i]+=wws[i-1];
for(i=n-1;i>=0;i--) sufix[--wws[x[i]]]=i;
for(j=1,p=1;p<n;j*=2,m=p)
{
for(p=0,i=n-j;i<n;i++) y[p++]=i;
for(i=0;i<n;i++) if(sufix[i]>=j) y[p++]=sufix[i]-j;
for(i=0;i<n;i++) wwv[i]=x[y[i]];
for(i=0;i<m;i++) wws[i]=0;
for(i=0;i<n;i++) wws[wwv[i]]++;
for(i=1;i<m;i++) wws[i]+=wws[i-1];
for(i=n-1;i>=0;i--) sufix[--wws[wwv[i]]]=y[i];
for(t=x,x=y,y=t,p=1,x[sufix[0]]=0,i=1;i<n;i++)
x[sufix[i]]=cmp(y,sufix[i-1],sufix[i],j)?p-1:p++;
}
return;
}
//保存初始字符串
int r[maxn];
//排名数组,公共长度数组,后缀数组
int rank[maxn],height[maxn],sufix[maxn];
//求height[i]=suffix(sa[i-1])和suffix(sa[i])的最长公共前缀,
//也就是排名相邻的两个后缀的最长公共前缀
//有height[i]>=h[i-1]-1
void calheight(int *r,int *sufix,int n){
int i,j,k=0;//记录排名
for(i=0;i<=n;i++) rank[sufix[i]]=i;
//记录排名相邻的后缀的公共子串长度
for(i=0;i<n;height[rank[i++]]=k)
for(k?k--:0,j=sufix[rank[i]-1];r[i+k]==r[j+k];k++);
return;
}
bool ch(int mid, int n, int k) {
int tot = 0, i;
for (i = 2;i <= n;i++) {
if (height[i] < mid) {
tot = 0;
}else {
tot++;
}
if (tot >= k-1) return true;
}
return false;
}
int main() {
int n, k, i, j;
while (~scanf("%d%d", &n, &k)) {
for (i = 0;i < n;i++) scanf("%d", &r[i]), r[i]++;
r[n] = 0;
da(r, sufix, n+1, 1000000);
calheight(r, sufix, n);
int f = 0, R = n, mid, ans = 0;
while (f <= R) {
mid = f+R>>1;
if (ch(mid, n, k)) ans = mid, f = mid+1;
else R = mid-1;
}
printf("%d\n", ans);
}
}