Boring String Problem【HDU-5008】【后缀数组+RMQ】

题目链接


  题意:有一个长度为n的字符串,现在我们要去找出它的字典序第k小的子串,需要保证与前k-1个子串完全不同,并且如果有多个选项,选择出现位置最前面的。

  思路:因为我们知道后缀数组的sa是根据所有后缀的字典序排序的,所以我们可以直接先去预处理不同子串的前缀和,然后我们就可以直接进行查询了,但是有可能存在一个有重复的子串,我们需要去找到它的可能的最先出现的位置,那么这里就可以用二分答案加上RMQ来进行查询。

  一个RMQ来查询区间段内的LCP的值;另一个RMQ来查对应sa区间的sa[i]的最小值,也就是最先出现的位置,就可以解决这个问题了。

#include <iostream>
#include <cstdio>
#include <cmath>
#include <string>
#include <cstring>
#include <algorithm>
#include <limits>
#include <vector>
#include <stack>
#include <queue>
#include <set>
#include <map>
#include <bitset>
#include <unordered_map>
#include <unordered_set>
#define lowbit(x) ( x&(-x) )
#define pi 3.141592653589793
#define e 2.718281828459045
#define INF 0x3f3f3f3f
#define HalF (l + r)>>1
#define lsn rt<<1
#define rsn rt<<1|1
#define Lson lsn, l, mid
#define Rson rsn, mid+1, r
#define QL Lson, ql, qr
#define QR Rson, ql, qr
#define myself rt, l, r
using namespace std;
typedef unsigned long long ull;
typedef unsigned int uit;
typedef long long ll;
const int maxN = 1e5 + 7;
struct SA
{
    int n, m;
    int s[maxN];
    int y[maxN], x[maxN], c[maxN], sa[maxN], rk[maxN], height[maxN];
    inline void get_SA()
    {
        for(int i=1; i<=m; i++) c[i] = 0;   //桶的初始化
        for(int i=1; i<=n; i++) ++c[x[i] = s[i]];
        for(int i=2; i<=m; i++) c[i] += c[i - 1];   //利用差分前缀和的思想知道每个关键字最多是在第几名
        for(int i=n; i>=1; i--) sa[c[x[i]]--] = i;
        for(int k=1; k<=n; k<<=1)
        {
            int num = 0;
            for(int i=n - k + 1; i<=n; i++) y[++num] = i;
            for(int i=1; i<=n; i++) if(sa[i] > k) y[++num] = sa[i] - k; //是否可以作为第二关键字
            for(int i=1; i<=m; i++) c[i] = 0;
            for(int i=1; i<=n; i++) c[x[i]]++;  //因为上一次循环已经求出这次的第一关键字了
            for(int i=2; i<=m; i++) c[i] += c[i - 1];
            for(int i=n; i>=1; i--) //在同一第一关键字下,按第二关键字来排
            {
                sa[c[x[y[i]]]--] = y[i];
                y[i] = 0;
            }
            swap(x, y);
            x[sa[1]] = 1; num = 1;
            for(int i=2; i<=n; i++)
            {
                x[sa[i]] = (y[sa[i]] == y[sa[i - 1]] && y[sa[i] + k] == y[sa[i - 1] + k]) ? num : ++num;
            }
            if(num == n) break;
            m = num;
        }
    }
    inline void get_height()
    {
        int k = 0;
        for(int i=1; i<=n; i++) rk[sa[i]] = i;
        for(int i=1; i<=n; i++)
        {
            if(rk[i] == 1) continue;    //第一名的height为0
            if(k) k--;  //height[i] >= height[i - 1] - 1
            int j = sa[rk[i] - 1];
            while(j + k <= n && i + k <= n && s[i + k] == s[j + k]) k++;
            height[rk[i]] = k;
        }
    }
    inline void clear()
    {
        n = 0; m = 200;
    }
} sa;
int N, M, LOG_2[maxN];
char s[maxN];
struct RMQ_Height
{
    int t[maxN][20];
    inline void init()
    {
        for(int i=1; i<=N; i++) t[i][0] = sa.height[i];
        for(int j=0; (1 << (j + 1)) <= N; j++)
        {
            for(int i=1; i + (1 << (j + 1)) - 1 <= N; i++)
            {
                t[i][j + 1] = min(t[i][j], t[i + (1 << j)][j]);
            }
        }
    }
    inline int query(ull l, ull r)
    {
        if(l > r) swap(l, r);
        l++;
        int k = LOG_2[r - l + 1];
        return min(t[l][k], t[r - (1 << k) + 1][k]);
    }
} rmq;
struct RMQ_Sa
{
    int t[maxN][20];
    inline void init()
    {
        for(int i=1; i<=N; i++) t[i][0] = sa.sa[i];
        for(int j=0; (1 << (j + 1)) <= N; j++)
        {
            for(int i=1; i + (1 << (j + 1)) - 1 <= N; i++)
            {
                t[i][j + 1] = min(t[i][j], t[i + (1 << j)][j]);
            }
        }
    }
    inline int query(ull l, ull r)
    {
        if(l > r) swap(l, r);
        int k = LOG_2[r - l + 1];
        return min(t[l][k], t[r - (1 << k) + 1][k]);
    }
} rm_sa;
struct node
{
    ll rk; int id, beg_id;
    node(ll a=0, int b=0, int c=0):rk(a), id(b), beg_id(c) {}
    friend bool operator < (node e1, node e2) { return e1.rk < e2.rk; }
};
ull pre[maxN] = {0};
ull EF(ull L, ull len)
{
    ll mid, ans = sa.rk[L];
    ll l = sa.rk[L] + 1, r = N;
    while(l <= r)
    {
        mid = HalF;
        if(rmq.query(sa.rk[L], mid) >= len)
        {
            ans = mid;
            l = mid + 1;
        }
        else
        {
            r = mid - 1;
        }
    }
    return rm_sa.query(sa.rk[L], ans);
}
int main()
{
    for(int i=2; i<maxN; i++) LOG_2[i] = LOG_2[i >> 1] + 1;
    while(scanf("%s", s) != EOF)
    {
        N = (int)strlen(s);
        sa.clear();
        for(int i=0; i<N; i++)
        {
            sa.s[++sa.n] = s[i];
        }
        sa.s[++sa.n] = 'a' + 26;
        sa.get_SA();
        sa.get_height();
        rmq.init();
        rm_sa.init();
//        for(int i=1; i<=N; i++) printf("%d%c", sa.sa[i], i == N ? '\n' : ' ');
        for(int i=1; i<=N; i++)
        {
            pre[i] = pre[i - 1] + (N - sa.sa[i] + 1 - sa.height[i]);
        }
        scanf("%d", &M);
        ull l = 0, r = 0, k, len;
        for(int i=1, it; i<=M; i++)
        {
            scanf("%lld", &k);
            k = l ^ r ^ k;
            k++;
            if(k > pre[N])
            {
                l = r = 0;
            }
            else
            {
                it = (int)(lower_bound(pre + 1, pre + N + 1, k) - pre);
                k -= pre[it - 1];
                len = sa.height[it] + k;
                l = sa.sa[it];
                l = EF(l, len);
                r = l + len - 1;
            }
            printf("%lld %lld\n", l, r);
        }
    }
    return 0;
}
/*
abaa
1
0
ans:
1 1
*/

 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Wuliwuliii

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值