【后缀数组】不同子串

【题目描述】

给定一个由小写英文字母构成的字符串T,求其不同子串个数。

【输入】

一个字符串,长度不超过100000。

没有传送门……

裸的后缀数组:所有子串就是各个后缀字符串的前缀,所以答案就是每一个后缀字符串的长度减去与前一个重复的字符个数的总和。

代码如下:

#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
const int N=1e5+10;
const int M=3e5+30;
typedef long long ll;
ll ans;int sa[M],px[M],n;
int t1[M],t2[M],buf[N],rvsa[N];
char S[N];

void query()
{
	ans+=n-rvsa[1]+1;
	for(int i=2;i<=n;i++){
		int p=n-rvsa[i-1]+1,a=rvsa[i-1];
		int q=n-rvsa[i]+1,b=rvsa[i];
		int u=0;
		while(u<p && u<q && S[u+a]==S[u+b]) u++;
		ans+=q-u;
	}
}

void build()
{
	int m=26;
	for(int i=1;i<=n;i++) px[S[i]-'a'+1]=1;
	for(int i=1;i<=m;i++) px[i]+=px[i-1];
	for(int i=1;i<=n;i++) sa[i]=px[S[i]-'a'+1];
	for(int k=0;(1<<k)<=n && m!=n;k++){
		for(int i=0;i<=m;i++) px[i]=0;
		for(int i=1;i<=n;i++) px[sa[i+(1<<k)]]++;
		for(int i=1;i<=m;i++) px[i]+=px[i-1];
		for(int i=n;i>=1;i--) t1[px[sa[i+(1<<k)]]--]=i;
		for(int i=0;i<=m;i++) px[i]=0;
		for(int i=1;i<=n;i++) px[sa[t1[i]]]++;
		for(int i=1;i<=m;i++) px[i]+=px[i-1];
		for(int i=n;i>=1;i--) t2[px[sa[t1[i]]]--]=t1[i];
		m=0;
		for(int i=1;i<=n;i++){
			if(sa[t2[i]]!=sa[t2[i-1]] || sa[t2[i]+(1<<k)]!=sa[t2[i-1]+(1<<k)])
			buf[t2[i]]=++m;else buf[t2[i]]=m;
		}
		for(int i=1;i<=n;i++) sa[i]=buf[i];
	}
	for(int i=1;i<=n;i++) rvsa[sa[i]]=i;
} 

int main(){
	scanf("%s",S+1);
	n=strlen(S+1);
	build();
	query();
	printf("%lld\n",ans);
	return 0;
}

 

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值