POJ 2406 Power Strings(KMP or 后缀数组 dc3板子)

题意:给出一个字符串 问它最多由多少相同的字串组成 


思路:有简单的KMP解法点击打开链接

也可以拿KMP做,n<=1e6 不能用倍增法,只能用dc3。

枚举长度i,如果长度i的子串刚好是重复了len/i次,要满足len % i == 0和rank[0] - rank[i] == 1 和height[rank[0]] == len-i(sa[0]与sa[i]的lcp为len-i)。


字符串abab:

ab

abab

b

bab


代码:

#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
const int maxn = 2e6+5;

#define F(x)((x)/3+((x)%3==1?0:tb)) //F(x)求出原字符串的suffix(x)在新的字符串中的起始位置
#define G(x)((x)<tb?(x)*3+1:((x)-tb)*3+2) //G(x)是计算新字符串的suffix(x)在原字符串中的位置,和F(x)为互逆运算
int wa[maxn],wb[maxn],wv[maxn],WS[maxn];
int sa[maxn*3] ; //第i小的后缀,起始位置在源字符串的位置
int ra[maxn],height[maxn]; //rank 以i为起始位置的后缀在后缀排列中的名次
int s[maxn*3]; //承接字符串,用来计算
char str[maxn];

int c0(int *r,int a,int b) {
    return r[a]==r[b] && r[a+1]==r[b+1] && r[a+2]==r[b+2];
}
int c12(int k,int *r,int a,int b) {
    if(k==2)
        return r[a]<r[b] || ( r[a]==r[b] && c12(1,r,a+1,b+1) );
    else
        return r[a]<r[b] || ( r[a]==r[b] && wv[a+1]<wv[b+1] );
}
void sort(int *r,int *a,int *b,int n,int m) {
    int i;
    for(i=0; i<n; i++)
        wv[i]=r[a[i]];
    for(i=0; i<m; i++)
        WS[i]=0;
    for(i=0; i<n; i++)
        WS[wv[i]]++;
    for(i=1; i<m; i++)
        WS[i]+=WS[i-1];
    for(i=n-1; i>=0; i--)
        b[--WS[wv[i]]]=a[i];
    return;
}

//注意点:为了方便下面的递归处理,r数组和sa数组的大小都要是3*n
void dc3(int *r,int *sa,int n,int m) { //rn数组保存的是递归处理的新字符串,san数组是新字符串的sa
    int i , j , *rn = r+n , *san = sa+n , ta = 0 ,tb = (n+1)/3 , tbc = 0 , p;
    r[n] = r[n+1] = 0;
    for(i=0; i<n; i++) {
        if(i%3!=0)
            wa[tbc++]=i; //tbc表示起始位置模3为1或2的后缀个数
    }
    sort(r+2,wa,wb,tbc,m);
    sort(r+1,wb,wa,tbc,m);
    sort(r,wa,wb,tbc,m);
    for(p=1,rn[F(wb[0])]=0,i=1; i<tbc; i++)
        rn[F(wb[i])]=c0(r,wb[i-1],wb[i])?p-1:p++;
    if(p<tbc)
        dc3(rn,san,tbc,p);
    else {
        for(i=0; i<tbc; i++)
            san[rn[i]]=i;
    }
//对所有起始位置模3等于0的后缀排序
    for(i=0; i<tbc; i++) {
        if(san[i]<tb)
            wb[ta++]=san[i]*3;
    }
    if(n%3==1)  //n%3==1,要特殊处理suffix(n-1)
        wb[ta++]=n-1;
    sort(r,wb,wa,ta,m);
    for(i=0; i<tbc; i++)
        wv[wb[i] = G(san[i])]=i;
//合并所有后缀的排序结果,保存在sa数组中
    for(i=0,j=0,p=0; i<ta&&j<tbc; p++)
        sa[p]=c12(wb[j]%3,r,wa[i],wb[j])?wa[i++]:wb[j++];
    for(; i<ta; p++)
        sa[p]=wa[i++];
    for(; j<tbc; p++)
        sa[p]=wb[j++];
    return;
}

//height[i]=suffix(sa[i-1])和suffix(sa[i])的最长公共前缀,也就是排名相邻的两个后缀的最长公共前缀
void calheight(int *r,int *sa,int n) {
    int i,j,k=0;
    for(i=1; i<=n; i++)
        ra[sa[i]]=i;
    for(i=0; i<n; height[ra[i++]]=k)
        for(k?k--:0,j=sa[ra[i]-1]; r[i+k]==r[j+k]; k++);
}

int main(void)
{
    while(~scanf(" %s", str))
    {
        int len = strlen(str);
        if(str[0] == '.' && len == 1) break;
        for(int i = 0; i < len; i++)
            s[i] = str[i]-'a'+1;
        s[len] = 0;
        dc3(s, sa, len+1, 105);
        calheight(s, sa, len);
        int ans = 1;
        for(int i = 1; i <= len; i++)
            if(len%i==0 && ra[0] == ra[i]+1 && height[ra[0]] == len-i)
            {
                ans = len/i;
                break;
            }
        printf("%d\n", ans);
    }
    return 0;
}


  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值