hdu 5008 (后缀数组 + rmq +二分)

题意:给出一个字符串,求出第k小的子串,并求出字符串的起止位置,如果有多个重复的子串,求出位置最靠左的子串。
思路:比赛时,想到了要用后缀数组,但是没想到如何做。
其实,因为子串是后缀的前缀,后缀数组对后缀排序的同时,也对子串进行了排序。对于每一个sa[i],会产生不同的n - sa[i] - height[i]个子串,这些子串也是排好序的。
这样,我们就我们就可以二分求出这些子串中的第k小的子串。
但是,因为我们没有考虑LCP,这样会导致对于相同的第k小,有些位置更靠左,且存在于公共前缀中的子串没有考虑到,这样,我们还需要对这些字符串进行考虑。
那如何求出最靠左的子串呢?首先要注意,前面找到的子串是在sa数组中,最先出现的子串,但不是在整个字符串最先出现的子串。我们从找到该子串的sa的位置开始,向后搜索,如果和该位置的LCP不小于找到子串的长度,那说明是可能的位置。因为,对于给定位置的LCP,他的长度是不增的,我们可以二分去找到整个可能的范围。最后在这个区间求一次RMQ就是最左的位置。

注意的点:第一个sa[0] 是最后添加的0字符,因为那个最大,第二个点 无论是sa 还是 height 从1开始,因为0都是最后我们添加的0,所以不会有影响。还有就是一些小细节 sa的值是从0开始的。

#include <bits/stdc++.h>
using namespace std;
const int MAXN = 1e5+100;
int t1[MAXN],t2[MAXN],c[MAXN];
typedef long long ll;
ll tol[MAXN];
char s[MAXN];

bool cmp(int *r,int a,int b,int l)
{
    return r[a]==r[b]&&r[a+l]==r[b+l];
}

void da(char str[],int sa[],int ra[],int height[],int n,int m)
{
    n++;
    int i,j,p,*x=t1,*y=t2;
    for(i=0;i<m;i++) c[i]=0;
    for(i=0;i<n;i++) c[x[i]=str[i]]++;
    for(i=1;i<m;i++) c[i]+=c[i-1];
    for(i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
    for(j=1;j<=n;j<<=1)
    {
        p=0;
        for(i=n-j;i<n;i++) y[p++]=i;
        for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
        for(i=0;i<m;i++) c[i]=0;
        for(i=0;i<n;i++) c[x[y[i]]]++;
        for(i=1;i<m;i++) c[i]+=c[i-1];
        for(i=n-1;i>=0;i--) sa[--c[x[y[i]]]]=y[i];
        swap(x,y);
        p=1;x[sa[0]]=0;
        for(i=1;i<n;i++)
            x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
        if(p>=n) break;
        m=p;
    }
    int k=0;
    n--;
    for(i=0;i<=n;i++) ra[sa[i]]=i;
    for(i=0;i<n;i++) 
    {
        if(k) k--;
        j=sa[ra[i]-1];
        while(str[i+k]==str[j+k])k++;
        height[ra[i]]=k;
    }
}

int ra[MAXN],height[MAXN];
int sa[MAXN];

int f1[MAXN][22],f2[MAXN][22];

void init1(int n)
{
    for(int i=1;i<=n;i++)
        f1[i][0]=sa[i];
    for(int j=1;(1<<j)<=n;j++)
    {
        for(int i=1;i+(1<<j)-1<=n;i++)
        {
            f1[i][j]=min(f1[i][j-1],f1[i+(1<<(j-1))][j-1]);
        }
    }
}


int rmq1(int i,int j)
{
    int k=0;
    while(1<<(k+1)<=(j-i+1)) k++;
    return min(f1[i][k],f1[j-(1<<k)+1][k]);
}

void init2(int n)
{
    for(int i=1;i<=n;i++)
        f2[i][0]=height[i];
    for(int j=1;(1<<j)<=n;j++)
    {
        for(int i=1;i+(1<<j)-1<=n;i++)
        {
            f2[i][j]=min(f2[i][j-1],f2[i+(1<<(j-1))][j-1]);
        }
    }
}


int rmq2(int i,int j)
{
    int k=0;
    while(1<<(k+1)<=(j-i+1)) k++;
    return min(f2[i][k],f2[j-(1<<k)+1][k]);
}


int main()
{
    while(~scanf(" %s",s))
    {
        int t;
        scanf("%d",&t);
        int len=strlen(s);
        da(s,sa,ra,height,len,130);
        int n=len;
        for(int i=1;i<=n;i++)
        tol[i]=tol[i-1]+n-sa[i]-height[i];
        init1(len);
        init2(len);
        int lll=0,rrr=0;
        int ans=0;
        while(t--)
        {
            ll k;
            scanf("%lld",&k);
            k=(lll^rrr^k)+1;
            if(k>tol[n])
            {
                lll=rrr=0;
                puts("0 0");
                continue;
            }
            int num=lower_bound(tol+1,tol+1+n,k)-tol;
            k-=tol[num-1];
            int st=sa[num];
            int ed=sa[num]+height[num]+k-1;
            int lenn=ed-st+1;
            int l=num+1,r=n;
            while(l<=r)
            {
                int mid=(l+r)>>1;
                int pan=rmq2(num+1,mid);
                if(pan>=lenn)
                    l=mid+1;
                else r=mid-1;
            }
            if(r>=num+1)
            ans=rmq1(num,r);
            else ans=st;
            lll=ans+1;
            rrr=ans+lenn;
            printf("%d %d\n",lll,rrr);
        }
    }
}
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值