SPOJ 694 / SPOJ DISUBSTR Distinct Substrings【后缀数组】不相同的子串的个数

Description

Given a string, we need to find the total number of its distinct substrings.

Input

T- number of test cases. T<=20;
Each test case consists of one string, whose length is <= 1000

Output

For each test case output one number saying the number of distinct substrings.

Example

Sample Input:
2
CCCCC
ABABA

Sample Output:
5
9

Explanation for the testcase with string ABABA: 
len=1 : A,B
len=2 : AB,BA
len=3 : ABA,BAB
len=4 : ABAB,BABA
len=5 : ABABA
Thus, total number of distinct substrings is 9.

Hint

Added by:Prasanna
Date:2006-01-13
Time limit:0.159s
Source limit:50000B
Memory limit:1536MB
Cluster:Cube (Intel G860)
Languages:All except: NODEJS PERL 6 VB.net
Resource:ByteCode '06



/*
    SPOJ DISUBSTR/SPOJ 694
    题意:给定一个字符串,求不相同子串个数.

    类型:后缀数组

    分析:每个子串一定是某个后缀的前缀,那么原问题等价于求所有后缀之间
          的前缀个数.
          当n=5,字符串为"ABABA"
          height    string     sa      前缀                    个数
                    A          4       A                        1
            1   <
                    ABA        2       A AB ABA                 3
            3   <
                    ABABA      0       A AB ABA ABAB ABABA      5
            0   <
                    BA         3       B BA                     2
            2   <
                    BABA       1       B BA BAB BABA            4
          把全部前缀个数加起来 - 前缀相同部分height = 答案
          全部前缀个数可以写成(1+n)*n/2
*/
#include<iostream>
#include<cstdio>
#include<algorithm>
#include<cstring>
using namespace std;
const int MAXN=1010;
int sa[MAXN];//sa[i]表示排在第i名的下标是多少,取值范围[1~n]
int rank[MAXN];//rank[i]表示以i为下标的后缀排在第几,取值范围[0~n-1]
int height[MAXN];//height[i]表示排在i-1名与排在第i名的最长公共前缀,取值范围[2~n]
int t1[MAXN],t2[MAXN],c[MAXN];//求sa数组需要的中间变量,不需要赋值初始化
int s[MAXN];
//待排序的字符串放在s数组中,从s[0]到s[n-1],长度为n,且最大值小于m.
//除s[n]为0 外的所有s[i]都大于0;函数结束以后结果放在sa数组中
void build_sa(int s[],int n,int m) //得到SA数组
{
    int i,j,p,*x=t1,*y=t2;
    for(i=0;i<m;i++)c[i]=0;
    for(i=0;i<n;i++)c[x[i]=s[i]]++;
    for(i=1;i<m;i++)c[i]+=c[i-1];
    for(i=n-1;i>=0;i--)sa[--c[x[i]]]=i;
    for(j=1;j<=n;j<<=1){
        p=0;
        for(i=n-j;i<n;i++)y[p++]=i;
        for(i=0;i<n;i++)if(sa[i]>=j)y[p++]=sa[i]-j;
        for(i=0;i<m;i++)c[i]=0;
        for(i=0;i<n;i++)c[x[y[i]]]++;
        for(i=1;i<m;i++)c[i]+=c[i-1];
        for(i=n-1;i>=0;i--)sa[--c[x[y[i]]]]=y[i];
        swap(x,y);
        p=1;x[sa[0]]=0;
        for(i=1;i<n;i++)
            x[sa[i]]=y[sa[i-1]]==y[sa[i]] && y[sa[i-1]+j]==y[sa[i]+j]?p-1:p++;
        if(p>=n)break;
        m=p;
    }
}
void getHeight(int s[],int n){ //得到height数组
    int i,j,k=0;
    for(i=0;i<=n;i++)rank[sa[i]]=i;
    for(i=0;i<n;i++){
        if(k)k--;
        j=sa[rank[i]-1];
        while(s[i+k]==s[j+k])k++;
        height[rank[i]]=k;
    }
}
int main()
{
    //freopen("F:\\input.txt","r",stdin);
    int n,t;
    char ss[MAXN];
    scanf("%d",&t);
    while(t--){
        scanf("%s",ss);
        n=strlen(ss);
        int Max=-1;
        for(int i=0;i<n;i++){
            s[i]=ss[i];
            if(s[i]>Max)Max=s[i];
        }
        s[n]=0;
        build_sa(s,n+1,Max+1);
        getHeight(s,n);
        int ans=(1+n)*n/2;
        for(int i=2;i<=n;i++){
            ans-=height[i];
        }
        printf("%d\n",ans);
    }
    return 0;
}


  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值