题意:
在一个串中找出重复出现次数至少为k的最长子串的长度。
做法:
首先跑出sa。
然后二分答案x,只要找到连续的一段height[i]>=x,如果这段的长度大于等于k-1就可行。
注意是k-1不是k。
因为height计算的是两个相邻排名的后缀的lcp,如果有k个串的最长公共子串都>=x,则只要他们之间的height>=x即可,他们之间只有k-1个height值。
易错点:
check扫height数组时注意循环外仍要判断一下len>=k-1。
代码:
/*************************************************************
Problem: poj 3261 Milk Patterns
User: bestFy
Language: C++
Result: Accepted
Time: 47MS
Memory: 1172K
Submit_Time: 2018-01-18 13:41:08
*************************************************************/
#include<cstdio>
#include<cstring>
#include<iostream>
#include<algorithm>
#include<cmath>
#include<cstdlib>
#include<cctype>
using namespace std;
const int N = 1000010;
int n, k, all;
int a[N], tong[N], rk[N], tp[N], h[N], sa[N];
inline void ssort() {
for(int i = 0; i <= all; i ++) tong[i] = 0;
for(int i = 1; i <= n; i ++) tong[rk[tp[i]]] ++;
for(int i = 1; i <= all; i ++) tong[i] += tong[i-1];
for(int i = n; i >= 1; i --) sa[tong[rk[tp[i]]] --] = tp[i];
}
inline void get_sa() {
for(int i = 1; i <= n; i ++) rk[i] = a[i], tp[i] = i;
ssort(); int w = 1; all = 1;
while(all < n) {
int t = 0;
for(int i = n-w+1; i <= n; i ++) tp[++ t] = i;
for(int i = 1; i <= n; i ++) if(sa[i] > w) tp[++ t] = sa[i]-w;
ssort(); for(int i = 1; i <= n; i ++) tp[i] = rk[i];
rk[sa[1]] = all = 1;
for(int i = 2; i <= n; i ++)
rk[sa[i]] = (tp[sa[i]] == tp[sa[i-1]] && tp[sa[i]+w] == tp[sa[i-1]+w])?all:++ all;
w <<= 1;
} int k = 0;
for(int i = 1; i <= n; i ++) {
if(k) k --; int j = sa[rk[i]-1];
for(; i+k<=n && j+k<=n && a[i+k] == a[j+k]; k ++);
h[rk[i]] = k;
}
}
inline bool check(int x) {
int len = 0;
for(int i = 1; i <= n; i ++)
if(h[i] >= x) len ++;
else {
if(len >= k-1) return 1;//是k-1不是k
len = 0;
}
return len >= k-1;//注意这里不能直接return 0!
}
int main() {
//freopen("testdata.in", "r", stdin);
scanf("%d%d", &n, &k);
for(int i = 1; i <= n; i ++) scanf("%d", &a[i]), all = max(all, a[i]);
get_sa();
int l = 0, r = n, mid, ans;
while(l <= r) {
mid = l+r>>1;
if(check(mid)) ans = mid, l = mid+1; else r = mid-1;
}
printf("%d\n", ans);
return 0;
}