[后缀数组]spoj694 Distinct Substrings/spoj705 New Distinct Substrings

今天接着讲后缀数组哈

spoj694
spoj705

一句话题意:
给定一个字符串,求不相同的子串的个数。

算法分析:

每个子串一定是某个后缀的前缀,那么原问题就能转换成求所有后缀之间的不相同的前缀的个数。这样就可以用我们的后缀数组了
如果所有的后缀按照
suffix(sa[1]),suffix(sa[2]),suffix(sa[3]),……,suffix(sa[n])
的顺序计算,不难发现,对于每一次新加进来的后缀suffix(sa[k]),它将产生n-sa[k]+1个新的前缀。但是其中有height[k]个是和前面的字符串的前缀是相同的。所以suffix(sa[k])将“贡献”出n-sa[k]+1-height[k]个不同的子串。累加后便是原问题的答案。这个做法的时间复杂度为O(n)。

既然方程式都给出来了,那问题是不是很简单了呢??

下面是spoj694的代码:

    #include <cstdio>
    #include <cstring>
    #include <algorithm>
    #include <iostream>
    #include <cmath>
    using namespace std;
    int sa[21000],y[21000],height[21000],wr[21000],rsort[21000],rank[21000],a[21000];
    char st[1010];
    bool cmp(int k1,int k2,int ln)
    {
    return wr[k1]==wr[k2]&&wr[k1+ln]==wr[k2+ln];
    }
    void get_sa(int n,int m)
    {
    int p,k,ln,i;
    for (i=1;i<=n;i++) rank[i]=a[i];
    //a数组:原字符串。rank数组:名次数组(即你排第几)
    for (i=0;i<=m;i++) rsort[i]=0;
    for (i=1;i<=n;i++) rsort[rank[i]]++;
    for (i=1;i<=m;i++) rsort[i]+=rsort[i-1];
    for (i=n;i>=1;i--) sa[rsort[rank[i]]--]=i;
    //sa数组:后缀数组(即排第几的是谁)
    //以上四句为基数排序
    p=0;ln=1;
    //ln为当前子串的长度,p表示有多少不相同的子串
    while (p<n)
    //如果p等于n,那么函数可以结束。因为在当前长度的字符串中,已经没有相同的字符串,接下来的排序不会改变rank值。
    {
    for (k=0,i=n-ln+1;i<=n;i++) y[++k]=i;
    for (i=1;i<=n;i++) if (sa[i]-ln>0) y[++k]=sa[i]-ln;
    for (i=1;i<=n;i++) wr[i]=rank[y[i]];
    //数组y保存的是对第二关键字排序的结果。
    //数组wr保存的是对第二关键字排序后的rank值
    //以下为对第一关键字排序
    for (i=1;i<=m;i++) rsort[i]=0;
    for (i=1;i<=n;i++) rsort[wr[i]]++;
    for (i=1;i<=m;i++) rsort[i]+=rsort[i-1];
    for (i=n;i>=1;i--) sa[rsort[wr[i]]--]=y[i];
    memcpy(wr,rank,sizeof(wr));
    p=1;rank[sa[1]]=1;
    for (i=2;i<=n;i++)
    {
    if (!cmp(sa[i],sa[i-1],ln)) p++;
    rank[sa[i]]=p;
    }
    //得到新的rank数组。这里要注意的是,可能有多个字符串的rank值是相同的,所以必须比较两个字符串是否完全相同
    m=p;ln*=2;
    }
    sa[0]=0;a[0]=0;
    }
    void get_he(int n)
    {
    int i,j,k=0;
    for(i=1;i<=n;i++)
    {
    j=sa[rank[i]-1];
    if (k) k--;
    while (a[i+k]==a[j+k]) k++;
    height[rank[i]]=k;
    }
    }
    int main()
    {
    int n,ans,u;
    scanf("%d",&u);
    while (u--)
    {
    scanf("%s",st+1);
    n=strlen(st+1);
    for (int i=1;i<=n;i++) a[i]=st[i];
    get_sa(n,128);
    get_he(n);
    ans=0;
    for (int i=1;i<=n;i++) ans+=n-sa[i]+1-height[i];//公式
    printf("%d\n",ans);
    }
    return 0;
    } 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值