Distinct Substrings(后缀数组的运用&&高度数组的运用)

题目链接

SPOJ-DISUBSTR

题意

给定一个字符串s,求s的所有子串不重复的个数。

分析

观察后缀数组,注意到子串一定是后缀数组中的后缀的前缀的一部分。即每一个后缀贡献len个子串(len是后缀的长度)。现在要去掉重复的子串,也就是去掉后缀的公共前缀,因为公共前缀贡献的子串是相同的。所以只需用所有的子串数减去公共前缀的长度和。

代码

#include <bits/stdc++.h>
#define rank ranka
using namespace std;
const int maxn=2e4+100;
int n,k,rank[maxn],tmp[maxn],sa[maxn],lcp[maxn];
string s;

bool cmp(int i,int j)
{
    if(rank[i]!=rank[j])
        return rank[i]<rank[j];
    else
    {
        int ri=i+k<=n?rank[i+k]:-1;
        int rj=j+k<=n?rank[j+k]:-1;
        return ri<rj;
    }
}
void get_sa()
{
    n=s.size();
    for(int i=0; i<=n; i++)
    {
        sa[i]=i;
        rank[i]=i<n?s[i]:-1;
    }
    for(k=1; k<=n; k*=2)
    {
        sort(sa,sa+n+1,cmp);
        tmp[sa[0]]=0;
        for(int i=1; i<=n; i++)
            tmp[sa[i]]=tmp[sa[i-1]]+(cmp(sa[i-1],sa[i])?1:0);
        for(int i=0; i<=n; i++)
            rank[i]=tmp[i];
    }

}
void get_lcp()
{
    for(int i=0; i<=n; i++)
        rank[sa[i]]=i;
    int h=0;
    lcp[0]=0;
    for(int i=0; i<n; i++)
    {
        int j=sa[rank[i]-1];
        if(h)
            h--;
        for(; i+h<n && j+h<n; h++)
            if(s[i+h]!=s[j+h])
                break;
        lcp[rank[i]-1]=h;
    }
}
int main()
{
    int N;
    cin>>N;
    while(N--)
    {
        cin>>s;
        get_sa();
        get_lcp();
        long long ans=(1+n)*n/2;
        for(int i=1;i<n;i++)
            ans-=lcp[i];
        cout<<ans<<endl;
    }
}

参考模板

高度数组模板
后缀数组模板

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值