POJ 3693 Maximum repetitionsubstring(后缀数组:循环子串)

273 篇文章 0 订阅
112 篇文章 0 订阅

POJ 3693 Maximum repetitionsubstring(后缀数组:循环子串)

http://poj.org/problem?id=3693

题意:给你一个长N的字符串,现在要你找出该字符串中具有最大循环节数目的连续子串,如果有多个答案输出字典序最小的.

分析: 罗穗骞《后缀数组——处理字符串的有力工具》论文例题,不过论文中讲解的比较难懂.

本题是SPOJ687的加强版,可以先看SPOJ687的解答:

http://blog.csdn.net/u013480600/article/details/23974119

假设我们现在已经记录了所有可以使得循环节最多的循环节长度(从小到大记录).

假设存在那个子串,该子串字典序最小且循环节最多.且该字串肯定是某一个后缀的前缀,我们只需要按sa数组去枚举所有后缀(因为sa[1]是字典序最小的后缀),然后对于每个sa[i],从小到大枚举可行循环节的长度(因为对于相同字典序时,长度短的字典序小),然后用LCP查询看看sa[i]与sa[i]+len的LCP是否>=len*ans.如果是,马上退出即可.(就算后面还有>=len*ans的情况,它们不是sa字典序大,就是len长度长).

AC代码:

#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
const int maxn=100000+10;
struct SuffixArray
{
    char s[maxn];
    int sa[maxn],rank[maxn],height[maxn];
    int t1[maxn],t2[maxn],c[maxn],n;
    int mm[maxn];//mm[i]=k表示2^k是正好小于i的那个k. 而2^(k+1)>i了.
    int dmin[maxn][20];
    void build_sa(int m)
    {
        int i,*x=t1,*y=t2;
        for(i=0;i<m;i++) c[i]=0;
        for(i=0;i<n;i++) c[x[i]=s[i]]++;
        for(i=1;i<m;i++) c[i]+=c[i-1];
        for(i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
        for(int k=1;k<=n;k<<=1)
        {
            int p=0;
            for(i=n-k;i<n;i++) y[p++]=i;
            for(i=0;i<n;i++)if(sa[i]>=k) y[p++]=sa[i]-k;
            for(i=0;i<m;i++) c[i]=0;
            for(i=0;i<n;i++) c[x[y[i]]]++;
            for(i=1;i<m;i++) c[i]+=c[i-1];
            for(i=n-1;i>=0;i--) sa[--c[x[y[i]]]] = y[i];
            swap(x,y);
            p=1,x[sa[0]]=0;
            for(i=1;i<n;i++)
                x[sa[i]]= y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k]? p-1:p++;
            if(p>=n) break;
            m=p;
        }
    }
    void build_height()
    {
        int i,j,k=0;
        for(i=0;i<n;i++)rank[sa[i]]=i;
        for(i=0;i<n;i++)
        {
            if(k)k--;
            j=sa[rank[i]-1];
            while(s[i+k]==s[j+k])k++;
            height[rank[i]]=k;
        }
    }
    void initMin()
    {
        mm[0]=-1;
        for(int i=1;i<=n;i++)
        {
            dmin[i][0]=height[i];
            mm[i]=((i&(i-1))==0)?mm[i-1]+1:mm[i-1];
        }
        for(int j=1;j<=mm[n];j++)
            for(int i=1;i+(1<<j)-1<=n;i++)
                dmin[i][j]=min(dmin[i][j-1] , dmin[i+(1<<(j-1))][j-1]);
    }
    int RMQ(int L,int R)//取得范围最小值
    {
        int k=mm[R-L+1];
        return min(dmin[L][k] , dmin[R-(1<<k)+1][k]);
    }
    int LCP(int i,int j)//求后缀i和j的LCP最长公共前缀
    {
        int L=rank[i],R=rank[j];
        if(L>R) swap(L,R);
        L++;
        return RMQ(L,R);
    }
}sa;
int cnt;
int res[maxn];
int main()
{
    int kase=1;
    while(scanf("%s",sa.s)==1)
    {
        int n=strlen(sa.s);
        if(n==1&&strcmp(sa.s,"#")==0) break;
        sa.s[n]=0;
        sa.n=n+1;
        sa.build_sa(128);
        sa.build_height();
        sa.initMin();
        int ans=1;
        cnt=0;
        for(int len=1;len<n;len++)
        {
            for(int j=0;j+len<n;j+=len)
            {
                int k=sa.LCP(j,j+len);
                int now=k/len+1;
                int jj=j-(len-k%len);//往前推到jj位置
                if(jj>=0)
                if(sa.LCP(jj,jj+len)/len+1 > now) now++;
                if(now>ans)
                {
                    ans=now;
                    cnt=0;
                    res[cnt++]=len;
                }
                else if(now == ans) res[cnt++]=len;
            }
        }
        int st,best_len=-1;
        for(int i=1;i<n&&best_len==-1;i++)
        {
            for(int j=0;j<cnt;j++)
            {
                int len = res[j];
                if(sa.sa[i]+len<n && sa.LCP(sa.sa[i],sa.sa[i]+len)>=(ans-1)*len )
                {
                    best_len=len;
                    st=sa.sa[i];
                    break;
                }
            }
        }
        printf("Case %d: ",kase++);
        for(int i=0;i<best_len*ans;i++)printf("%c",sa.s[st+i]);
        printf("\n");
    }
    return 0;
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值