做法:
- 原题给的提示已经讲解的非常详细,这里说一下自己对下面式子的理解
- lcp( p - ( l - lcp (p,p+l) % l ) , p-l + lcp (p,p+l) % l +l)
- lcp(p,p+l)/l +1 是连续重复子串的个数
- lcp(p,p+l)%l 就是多出的一部分,这部分串来自后缀p+l
- 比如原题中给的栗子,lcp(4,4+4) = lcp(4,8) = 6
- 后缀4和后缀8的最长公共前缀是4,6%4 = 2,余出来的这两个长度就是多出来的
- 现在,为了解决连续重复子串的起始位置不是从l的倍数开始的问题,所以p位置之前的位置我们要好好思考。
- 那么l - lcp (p,p+l) % l 就是需要p位置前访问的前缀的距离
- p - (l - lcp (p,p+l) % l ) 就是需要进行探测的后缀下标,因为这个地方如同原题提示所说
- 它最多在增加一个循环节,所以需要进行一次大小比较,如果这个位置的后缀无法使得答案增大,那么它后面的位置也一定不可能,后面的位置不可能,那么它前面的位置更不可能,因为后面都失配了,前面也就没有意义了!
- ORZ
AC代码:
#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>
#include <cmath>
#define IO ios_base::sync_with_stdio(0),cin.tie(0),cout.tie(0)
#define pb(x) push_back(x)
#define sz(x) (int)(x).size()
#define sc(x) scanf("%d",&x)
#define abs(x) ((x)<0 ? -(x) : x)
#define all(x) x.begin(),x.end()
#define mk(x,y) make_pair(x,y)
#define fin freopen("in.txt","r",stdin)
#define fout freopen("out.txt","w",stdout)
using namespace std;
typedef long long ll;
typedef pair<int,int> PII;
const int mod = 1e9+7;
const double PI = 4*atan(1.0);
const int maxm = 1e5+5;
const int maxn =1e5+5;
const int INF = 0x3f3f3f3f;
const ll LINF = 1ll<<62;
const int m = 128; //
char s[maxn]; //待排序的字符串放在s数组中,从s[0~n-1],长度为n,且最大值小于m,最后一位是0(无效值)
int sa[maxn],t1[maxn],t2[maxn],c[maxn],n; //sa[1~n]为有效值,sa[0]必定为n是无效值
int rk[maxn]; //rank[0~n-1]为有效值,rank[n]必定为0无效值
int height[maxn]; //height[1~n]
//lcp(x,y):字符串x与字符串y的最长公共前缀,在这里指x号后缀与与y号后缀的最长公共前缀
//height[i]:lcp(sa[i],sa[i-1]),即排名为i的后缀与排名为i-1的后缀的最长公共前缀
//H[i]:height[rak[i]],即i号后缀与它前一名的后缀的最长公共前缀
void build_sa(int m)
{
n++;
int *x = t1,*y = t2;
for(int i=0;i<m;i++) c[i] = 0;
for(int i=0;i<n;i++) c[x[i] = s[i]]++;
for(int i=1;i<m;i++) c[i]+=c[i-1];
for(int i=n-1;i>=0;i--) sa[--c[x[i]]] = i;
for(int j=1;j<=n;j<<=1)
{
int p = 0;
for(int i = n-j;i<n;i++) y[p++] = i;
for(int i=0;i<n;i++) if(sa[i]>=j) y[p++] = sa[i]-j;
for(int i=0;i<m;i++) c[i] = 0;
for(int i=0;i<n;i++) c[x[y[i]]]++;
for(int i=1;i<m;i++) c[i]+=c[i-1];
for(int i=n-1;i>=0;i--) sa[--c[x[y[i]]]] = y[i];
swap(x,y);
p = 1;x[sa[0]] = 0;
for(int i=1;i<n;i++)
x[sa[i]] = (y[sa[i-1]] == y[sa[i]] && y[sa[i-1]+j] == y[sa[i]+j])?p-1:p++;
if(p>=n) break;
m = p;
}
n--;
int k = 0;
for(int i=0;i<=n;i++) rk[sa[i]] = i;
for(int i=0;i<n;i++){
if(k) k--;
int j = sa[rk[i]-1];
while(s[i+k] == s[j+k]) k++;
height[rk[i]] = k;
}
}
int dp[maxn][30];
void init_rmq()
{
for(int i=1;i<=n;i++) dp[i][0] = height[i];
for(int j=1;(1<<j)<=n;j++)
{
for(int i=1;i+(1<<j)-1<=n;i++)
{
dp[i][j] = min(dp[i][j-1],dp[i+(1<<(j-1))][j-1]);
}
}
}
int query(int i,int j)
{
int k = 0;
int l = rk[i], r = rk[j];
if(l>r) swap(l,r);
l++;
while(1<<(k+1)<=r-l+1) k++;
return min(dp[l][k],dp[r-(1<<k)+1][k]);
}
int main()
{
// fin;
IO;
cin>>s;
n = strlen(s);
build_sa(m);
init_rmq();
int ans = -1;
for(int l = 1;l<=n;l++)
{
for(int i=0;i+l<n;i+=l)
{
int lcp = query(i,i+l); //后缀i与后缀i+l的最大公共前缀
ans = max(ans,lcp/l+1); //lcp/l+1就是连续重复子串的重复次数,容易想
if(i >= l-lcp%l) ans = max(query(i-(l-lcp%l),i+lcp%l)/l+1,ans);
}
}
cout<<ans<<endl;
return 0;
}