[spoj694]不相同的子串的个数

14 篇文章 0 订阅
7 篇文章 0 订阅

给定一个字符串,求不相同的子串的个数。
算法分析:

每个子串一定是某个后缀的前缀,那么原问题等价于求所有后缀之间的不相同的前缀的个数。如果所有的后缀按照suffix(sa[1]), suffix(sa[2]),suffix(sa[3]),……,suffix(sa[n])的顺序计算,不难发现,对于每一次新加进来的后缀suffix(sa[k]),它将产生n-sa[k]+1个新的前缀。但是其中有height[k]个是和前面的字符串的前缀是相同的。所以suffix(sa[k])将“贡献”出n-sa[k]+1-height[k]个不同的子串。累加后便是原问题的答案。这个做法
的时间复杂度为O(n)。

#include<cmath>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<iostream>
#include<algorithm>
using namespace std;
char a[210000];int wr[210000],mc[210000],JS[210000],sa[210000],y[210000],height[210000];
bool cmp(int k1,int k2,int ln){
    return wr[k1]==wr[k2]&&wr[k1+ln]==wr[k2+ln];
}
void get_sa(int n,int m){//构建SA后缀数组
    int i,k,p,ln;
    //memcpy(mc,a,sizeof(a)); 
    for(i=1;i<=n;i++)mc[i]=a[i];
    //a数组:原字符串,mc名次数组
    for(i=0;i<=m;i++)JS[i]=0; 
    for(i=1;i<=n;i++)JS[mc[i]]++;
    for(i=1;i<=m;i++)JS[i]+=JS[i-1];
    for(i=n;i>=1;i--)sa[JS[mc[i]]--]=i;  
    //以上四句为基数排序,不懂的看flash
    ln=1;p=0; 
    //ln为当前子串的长度,p表示有多少不相同的子串
    while(p<n){
        for(k=0,i=n-ln+1;i<=n;i++)y[++k]=i;
        for(i=1;i<=n;i++)if(sa[i]-ln>0)y[++k]=sa[i]-ln;
        for(i=1;i<=n;i++)wr[i]=mc[y[i]];
        //数组y保存的是对第二关键字排序的结果 。
        //数组wr保存的是对第二关键字排序后的mc值
        //以下为对第一关键字排序
        for(i=0;i<=m;i++)JS[i]=0;
        for(i=1;i<=n;i++)JS[wr[i]]++;
        for(i=1;i<=m;i++)JS[i]+=JS[i-1];
        for(i=n;i>=1;i--)sa[JS[wr[i]]--]=y[i];
        memcpy(wr,mc,sizeof(wr));   
        p=1;mc[sa[1]]=1;
        for(i=2;i<=n;i++){
            if(!cmp(sa[i],sa[i-1],ln))p++;
            mc[sa[i]]=p;
        }
        //得到新的mc数组
        m=p;ln*=2;
    }
    a[0]=0;sa[0]=0;
}
void get_he(int n){
    int i,j,k=0;
    for(i=1;i<=n;i++){
        j=sa[mc[i]-1];
        if(k)k--;
        while(a[j+k]==a[i+k])k++;
        height[mc[i]]=k;
    }
}
int main(){
    int t;
    scanf("%d",&t);
    while(t--){
        scanf("%s",a+1);
        int n=strlen(a+1);
        get_sa(n,256);get_he(n);
        int ans=0;
        for(int i=1;i<=n;i++)ans+=n-sa[i]+1-height[i];
        printf("%d\n",ans);
    }
    return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值