[Hihocoder](1419)后缀数组四·重复旋律4 ---- 后缀数组(最长连续重复子串)★

题目传送门

做法:

  • 原题给的提示已经讲解的非常详细,这里说一下自己对下面式子的理解
  • lcp( p - ( l - lcp (p,p+l) % l ) , p-l + lcp (p,p+l) % l +l)
  • lcp(p,p+l)/l +1 是连续重复子串的个数
  • lcp(p,p+l)%l 就是多出的一部分,这部分串来自后缀p+l
  • 比如原题中给的栗子,lcp(4,4+4) = lcp(4,8) = 6
  • 后缀4和后缀8的最长公共前缀是4,6%4 = 2,余出来的这两个长度就是多出来的
  • 现在,为了解决连续重复子串的起始位置不是从l的倍数开始的问题,所以p位置之前的位置我们要好好思考。
  • 那么l - lcp (p,p+l) % l 就是需要p位置前访问的前缀的距离
  • p - (l - lcp (p,p+l) % l ) 就是需要进行探测的后缀下标,因为这个地方如同原题提示所说
  • 它最多在增加一个循环节,所以需要进行一次大小比较,如果这个位置的后缀无法使得答案增大,那么它后面的位置也一定不可能,后面的位置不可能,那么它前面的位置更不可能,因为后面都失配了,前面也就没有意义了!
  • ORZ

AC代码:

#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>
#include <cmath>
#define IO          ios_base::sync_with_stdio(0),cin.tie(0),cout.tie(0)
#define pb(x)       push_back(x)
#define sz(x)       (int)(x).size()
#define sc(x)       scanf("%d",&x)
#define abs(x)      ((x)<0 ? -(x) : x)
#define all(x)      x.begin(),x.end()
#define mk(x,y)     make_pair(x,y)
#define fin         freopen("in.txt","r",stdin)
#define fout        freopen("out.txt","w",stdout)
using namespace std;
typedef long long ll;
typedef pair<int,int> PII;
const int mod = 1e9+7;
const double PI = 4*atan(1.0);
const int maxm = 1e5+5;
const int maxn =1e5+5;
const int INF = 0x3f3f3f3f;
const ll LINF = 1ll<<62;
const int m = 128; //
char s[maxn]; //待排序的字符串放在s数组中,从s[0~n-1],长度为n,且最大值小于m,最后一位是0(无效值)
int sa[maxn],t1[maxn],t2[maxn],c[maxn],n; //sa[1~n]为有效值,sa[0]必定为n是无效值
int rk[maxn]; //rank[0~n-1]为有效值,rank[n]必定为0无效值
int height[maxn]; //height[1~n]
//lcp(x,y):字符串x与字符串y的最长公共前缀,在这里指x号后缀与与y号后缀的最长公共前缀
//height[i]:lcp(sa[i],sa[i-1]),即排名为i的后缀与排名为i-1的后缀的最长公共前缀
//H[i]:height[rak[i]],即i号后缀与它前一名的后缀的最长公共前缀
void build_sa(int m)
{
    n++;
    int *x = t1,*y = t2;
    for(int i=0;i<m;i++) c[i] = 0;
    for(int i=0;i<n;i++) c[x[i] = s[i]]++;
    for(int i=1;i<m;i++) c[i]+=c[i-1];
    for(int i=n-1;i>=0;i--) sa[--c[x[i]]] = i;
    for(int j=1;j<=n;j<<=1)
    {
        int p = 0;
        for(int i = n-j;i<n;i++) y[p++] = i;
        for(int i=0;i<n;i++) if(sa[i]>=j) y[p++] = sa[i]-j;
        for(int i=0;i<m;i++) c[i] = 0;
        for(int i=0;i<n;i++) c[x[y[i]]]++;
        for(int i=1;i<m;i++) c[i]+=c[i-1];
        for(int i=n-1;i>=0;i--) sa[--c[x[y[i]]]] = y[i];
        swap(x,y);
        p = 1;x[sa[0]] = 0;
        for(int i=1;i<n;i++)
            x[sa[i]] = (y[sa[i-1]] == y[sa[i]] && y[sa[i-1]+j] == y[sa[i]+j])?p-1:p++;
        if(p>=n) break;
        m = p;
    }
    n--;
    int k = 0;
    for(int i=0;i<=n;i++) rk[sa[i]] = i;
    for(int i=0;i<n;i++){
        if(k) k--;
        int j = sa[rk[i]-1];
        while(s[i+k] == s[j+k]) k++;
        height[rk[i]] = k;
    }
}
int dp[maxn][30];
void init_rmq()
{
    for(int i=1;i<=n;i++) dp[i][0] = height[i];
    for(int j=1;(1<<j)<=n;j++)
    {
        for(int i=1;i+(1<<j)-1<=n;i++)
        {
            dp[i][j] = min(dp[i][j-1],dp[i+(1<<(j-1))][j-1]);
        }
    }
}
int query(int i,int j)
{
    int k = 0;
    int l = rk[i], r = rk[j];
    if(l>r) swap(l,r);
    l++;
    while(1<<(k+1)<=r-l+1) k++;
    return min(dp[l][k],dp[r-(1<<k)+1][k]);
}
int main()
{
    // fin;
    IO;
    cin>>s;
    n = strlen(s);
    build_sa(m);
    init_rmq();
    int ans = -1;
    for(int l = 1;l<=n;l++)
    {
        for(int i=0;i+l<n;i+=l)
        {
            int lcp = query(i,i+l); //后缀i与后缀i+l的最大公共前缀
            ans = max(ans,lcp/l+1); //lcp/l+1就是连续重复子串的重复次数,容易想
            if(i >= l-lcp%l) ans = max(query(i-(l-lcp%l),i+lcp%l)/l+1,ans);
        }
    }
    cout<<ans<<endl;
    return 0;
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值