SPOJ 687 Repeats 后缀数组+暴力+rmq

题意:给出一个字符串,求出一个连续的重复次数最多的子串,并输出重复次数。

思路:后缀数组中的一个例题,思路里面已经提供了,但是里面只是写了思想。这里重新整理一下。

我们枚举所有的长度L。对于每个L,我们可以考察以r[i*L]开始,以r[(i+1)*L]为结束的子串的向前向后最长匹配长度。向后匹配,我们可以利用后缀数组求出的height来进行rmq.但是,向前匹配,该如何处理呢?应该想到,我们可以对待判定子串进行向前偏移,求偏移后的坐标的最长向后匹配,这就等价于原来子串的向前匹配的最大长度。

下面,我们就来确定向前偏移的大小。因为我们可以很容易的得到向后匹配的最大长度,但是可能会比L的整数倍多出几个字符。对于多匹配的这些字符,如果向前能够再凑出一个长度为L的匹配。这就是向前的最大匹配长度,即默认为我们考虑的子串是第一或第二个重复。(如果我们是从前到后考虑,必然可以保证如果是第三个或者是更大的重复,一定会在前面出现。)

在这个题中,我是第一次自己写后缀数组的rmq。感觉有以下注意点:

1.st表中,下标是从1开始的,查询是闭区间[l,r]。

2.st表中的顺序是后缀数组中的顺序,如果用字符串下标,需要利用rank数组来求出其在后缀数组的位置。

3.在height数组中,查询lcp的时候,我们要对左端点+1.

自己被坑的地方,就是用dc3会爆空间,但是spoj返回的是wa......

复杂度:核心算法的复杂度:n + n /2 + n /3 + n /4 + ... + 1 = O(nlgn)

代码如下:

#include <cstring>
#include <cstdio>
#include <algorithm>

using namespace std;

struct suffix_array{
    static const int maxn =100100;
    int rank[maxn],sa[maxn],height[maxn];
    int a[maxn],b[maxn],count[200000];
    //待排序字符串为r,长度为n,范围r[0] - r[n-1],值额范围0 - n-1.
    //字符集为m,范围1 - m;

    void radix_sort(int * r, int *a, int *b, int n, int m){//将a按照r进行基数排序,储存到b,长度为n,字符集为m
        memset(count,0,sizeof(count));
        for(int i = 0; i < n; ++i) ++count[r[a[i]]];
        for(int i = 1; i <= m; ++i) count[i] += count[i-1];
        for(int i = n -1; i >= 0; --i) b[--count[r[a[i]]]] = a[i];
    }

    void calc_sa(int*r, int n, int m){
        for(int i = 0; i < n; ++i) rank[i] =i;
        radix_sort(r,rank,sa,n,m);

        rank[sa[0]] = 0;
        for(int i = 1; i < n; ++i)
            rank[sa[i]]= rank[sa[i-1]] +(r[sa[i]]!=r[sa[i-1]]);
        for(int i = 0; 1<<i< n; ++i){
            for(int j = 0; j < n; ++j){
                a[j] = rank[j]+1;
                b[j] = j + (1<<i) >=n? 0: rank[j + (1<<i)] + 1;
                sa[j] = j;
            }
            radix_sort(b,sa,rank,n,n);
            radix_sort(a,rank,sa,n,n);
            rank[sa[0]] = 0;
            for(int j = 1; j < n; ++j){
                rank[sa[j]] = rank[sa[j-1]] + (a[sa[j-1]] != a[sa[j]] || b[sa[j-1]] != b[sa[j]]);
            }
        }
    }

    void calc_height(int * r,int n) {//计算height
        for(int i = 0 ; i < n; ++i) rank[sa[i]] = i;
        int h = 0;
        for(int i = 0; i < n; ++i){
            h = h == 0?0: h - 1;
            if(rank[i]!= 0)
                while(r[i + h] == r[sa[rank[i]-1] + h]) h++;
            height[rank[i]] = h;
        }
    }
    static const int MAX = 200100;
    int p[MAX];
    int d[MAX][20];
    void rmq_init(int n){
        p[0] = -1;
        for(int i = 1; i <= n; ++i)
            p[i] = i & (i-1)?p[i-1]:p[i-1]+1;
        for(int i = 1; i <= n; ++i) d[i][0] = height[i-1];
        for(int j = 1; j <= p[n]; ++j)
            for(int i = 1; i + (1 << j) - 1 <= n; ++i)
                d[i][j] = min(d[i][j-1],d[i+(1<<j-1)][j-1]);
    }
    int rmp_query(int l, int r){
        int k = p[r - l + 1];
        return min(d[l][k],d[r - (1<<k) + 1][k]);
    }
    int lcp(int l, int r){
        l = rank[l], r = rank[r];
        if(l > r) swap(l,r);l++;
        return rmp_query(l+1,r+1);
    }
    int solve(int n){
        int ret = 0;
        for(int l = 1; l < n; ++l){
            for(int i = 0; i + l < n; i += l){
                int ans = lcp(i,i+l);
                int j = i - (l - ans % l);
                ans = ans / l + 1;
                if(j >= 0 && lcp(j,j+l) >= l) ans++;
                ret = max(ret,ans);
            }
        }
        return ret;
    }

} solver;

int T,N;
char ch[2];
int r[100010];
int main(void)
{
    //freopen("input.txt","r",stdin);
    scanf("%d",&T);
    while(T--){
        scanf("%d",&N);
        for(int i = 0; i < N; ++i){
            scanf("%1s",ch);
            r[i] = ch[0];
        }
        solver.calc_sa(r,N,256);
        solver.calc_height(r,N);
        solver.rmq_init(N);
        //solver.print(r,N);
        printf("%d\n",solver.solve(N));
    }
    return 0;
}

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值