Prefixes and Suffixes - Codeforces432D(后缀数组)

给一个串,找到这样的子串:它既是这个母串的前缀,又是这个母串的后缀。统计这样的串的个数,长度和在母串中总共的出现次数。


解法:

首先把后缀数组排出来,找到代表母串的那个后缀的rank,这个rank设为st。

有一个结论比较重要:

“设有一个子串x满足这个条件(它既是母串前缀,又是母串后缀),设这个子串所表示  的后缀  的位置为r。

则r上面就必定没有和这个后缀相等的串了。”

这个是由于后缀数组的修正(在最后加一个比所有原串中字符小的字符)导致的。

所以做法就是,先预处理出一个arr数组,arr[x]表示的是st到x的最小值。

然后从st向上扫描,扫描到满足(它既是母串前缀,又是母串后缀),二分答案,找到最远的这个x,那么每个子串的个数就出现了。 

注意一下 原串 这个特殊情况。


#include<iostream>
#include<cstdio>
#include<cstring>
#include<vector>
#include<algorithm>
using namespace std;
const int nMax = 500001;


char str[nMax+1];
int sa[nMax], rk[nMax], height[nMax];
int wa[nMax], wb[nMax], wv[nMax], wd[nMax];
int cmp(int *r, int a, int b, int l){
    return r[a] == r[b] && r[a+l] == r[b+l];
}

void da(char *r, int n, int m){          //  倍增算法 r为待匹配数组  n为总长度 m为字符范围
    int i, j, p, *x = wa, *y = wb, *t;
    for(i = 0; i < m; i ++) wd[i] = 0;
    for(i = 0; i < n; i ++) wd[x[i]=r[i]] ++;
    for(i = 1; i < m; i ++) wd[i] += wd[i-1];
    for(i = n-1; i >= 0; i --) sa[-- wd[x[i]]] = i;
    for(j = 1, p = 1; p < n; j *= 2, m = p){
        for(p = 0, i = n-j; i < n; i ++) y[p ++] = i;
        for(i = 0; i < n; i ++) if(sa[i] >= j) y[p ++] = sa[i] - j;
        for(i = 0; i < n; i ++) wv[i] = x[y[i]];
        for(i = 0; i < m; i ++) wd[i] = 0;
        for(i = 0; i < n; i ++) wd[wv[i]] ++;
        for(i = 1; i < m; i ++) wd[i] += wd[i-1];
        for(i = n-1; i >= 0; i --) sa[-- wd[wv[i]]] = y[i];
        for(t = x, x = y, y = t, p = 1, x[sa[0]] = 0, i = 1; i < n; i ++){
            x[sa[i]] = cmp(y, sa[i-1], sa[i], j) ? p - 1: p ++;
        }
    }
}

void calHeight(char *r, int n){           //  求height数组。
    int i, j, k = 0;
    for(i = 1; i <= n; i ++)
    {
        rk[sa[i]] = i;
    }
    for(i = 0; i < n; height[rk[i ++]] = k){
        for(k ? k -- : 0, j = sa[rk[i]-1]; r[i+k] == r[j+k]; k ++);
    }
}

struct ANS
{
    int l,c;
    bool operator < (const ANS tar) const
    {
        if(tar.l > l) return true;
        return false;
    }
};

vector<ANS> ans;
int arr[nMax];

void init()
{
    ans.clear();
    memset(height,0,sizeof(height));
    memset(arr,0,sizeof(arr));
}

void process(int len)
{
    int st = rk[0];
    int minh = 0x3f3f3f3f;
    for(int i = st+1;i<len;i++)
    {
        arr[i] = min(minh,height[i]);
        minh = min(minh,height[i]);
    }
}

int bin(int tar,int st,int len)
{
    int l = st+1;
    int r = len;
    int ans = st;
    while(l<=r)
    {
        int mid = (l+r)/2;
        if(arr[mid]>=tar)
        {
            ans = max(ans,mid);
            l = mid+1;
        }
        else r = mid-1;
    }
    return ans;
}

void work_1(int len)
{
    int st = rk[0];
    int pre = 0x3f3f3f3f;
    for(int i = st;i>=0;i--)
    {
        pre = min(height[i],pre);
        if(pre == 0) break;
        if(sa[i-1]+pre == len-1)
        {
            int x = bin(pre,st,len);
            ANS tmp;
            tmp.l = pre;
            tmp.c = x - (i-1) + 1;
            ans.push_back(tmp);
        }
    }
}



int main()
{
    while(scanf("%s",str)!=EOF)
    {
        init();
        int len = strlen(str);
        str[len+1] = 0;
        da(str,len+1,128);
        calHeight(str,len);

        process(len+1);
        work_1(len+1);

        ANS tmp;
        tmp.l = len;
        tmp.c = 1;
        ans.push_back(tmp);

        sort(ans.begin(),ans.end());
        printf("%d\n",ans.size());
        for(int i = 0;i<ans.size();i++)
        {
            printf("%d %d\n",ans[i].l,ans[i].c);
        }
    }
    return 0;
}
/*
AAAAAAAAAAAAAAAAXAAAAAAAAAAAAAAAAAAAAAAA
*/




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值