spoj705 D - New Distinct Substrings(后缀数组)

题意

给定一个串,求其不同子串的个数。

题解

又见后缀数组鬼题,数据范围1e3的代码跑到5e4的就过不了了,gg。

题解详见罗穗骞奆神的论文《后缀数组——处理字符串的有力工具》

“每个子串一定是某个后缀的前缀,那么原问题等价于求所有后缀之间的不相同的前缀的个数。

如果所有的后缀按照suffix(sa[1]), suffix(sa[2]),suffix(sa[3]), …… ,suffix(sa[n])的顺序计算,

不难发现,对于每一次新加进来的后缀suffix(sa[k]),它将产生n-sa[k]+1 个新的前缀。

但是其中有height[k]个是和前面的字符串的前缀是相同的。

所以suffix(sa[k])将“贡献”出n-sa[k]+1- height[k]个不同的子串。

累加后便是原问题的答案。这个做法的时间复杂度为O(n)。”

心得

即对于ABAAC来说,BAAC将产生以B为起点的子串,

注意到所有子串都是后缀的前缀,则固定左端点B,右端点有四个选择B、A、A、C,

所以对于每个起点来说,对子串的贡献就是该后缀长度,即n-sa[i](这里sa值从0取)

而每个子串和它前面已出现的公共子串的个数,等于字典序排在它前一位的串与它的最长公共前缀的子串个数(LCP Theory)

最长公共前缀=height[i],又串长=个数,故每个起点的贡献是n-sa[i]-height[i],累加即可。

思路来源

https://blog.csdn.net/Clove_unique/article/details/53884641

代码实现

#include<iostream>
#include<cstring>
#include<cstdio>
using namespace std;
#define N 50005

int T,n,m,ans;
char s[N];
int *x,*y,X[N],Y[N],c[N],sa[N],height[N],Rank[N];

void clear()
{
    n=ans=0;
    memset(X,0,sizeof(X));memset(Y,0,sizeof(Y));memset(c,0,sizeof(c));
    memset(sa,0,sizeof(sa));memset(height,0,sizeof(height));memset(Rank,0,sizeof(Rank));
}
void build_sa()
{
    m=200;
    x=X,y=Y;
    for (int i=0;i<m;++i) c[i]=0;
    for (int i=0;i<n;++i) ++c[x[i]=s[i]];
    for (int i=0;i<m;++i) c[i]+=c[i-1];
    for (int i=n-1;i>=0;--i) sa[--c[x[i]]]=i;

    for (int k=1;k<=n;k<<=1)
    {
        int p=0;
        for (int i=n-k;i<n;++i) y[p++]=i;
        for (int i=0;i<n;++i) if (sa[i]>=k) y[p++]=sa[i]-k;

        for (int i=0;i<m;++i) c[i]=0;
        for (int i=0;i<n;++i) ++c[x[y[i]]];
        for (int i=0;i<m;++i) c[i]+=c[i-1];
        for (int i=n-1;i>=0;--i) sa[--c[x[y[i]]]]=y[i];

        swap(x,y);
        p=1;x[sa[0]]=0;
        for (int i=1;i<n;++i)
            x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&((sa[i-1]+k<n?y[sa[i-1]+k]:-1)==(sa[i]+k<n?y[sa[i]+k]:-1))?p-1:p++;
        if (p>n) break;
        m=p;
    }
}
void build_height()
{
    for (int i=0;i<n;++i) Rank[sa[i]]=i;
    int k=0;height[0]=0;
    for (int i=0;i<n;++i)
    {
        if (!Rank[i]) continue;
        if (k) --k;
        int j=sa[Rank[i]-1];
        while (i+k<n&&j+k<n&&s[i+k]==s[j+k]) ++k;
        height[Rank[i]]=k;
    }
}
int main()
{
    scanf("%d\n",&T);
    while (T--)
    {
        clear();
        scanf("%s",s);
		n=strlen(s);
        build_sa();
        build_height();
        for (int i=0;i<n;++i)
            ans+=n-sa[i]-height[i];
        printf("%d\n",ans);
    }
    return 0; 
} 

自己的板子就会出现各种RE、WA的错误,网上代码就能一遍A,

比对一下发现好像没差什么,很迷啊...

后续

编译环境C++ (gcc 6.3),我记住你了。。

long long ans;int n=5e5;

ans=n*(n+1)/2越界了,把n改成long long就过了。

一小时对拍宛若智障。。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值