HDU5659 CA Loves Substring【后缀自动机求切开某个位置后的不同子串个数】

题目描述:

从字符串 S S S的某个位置 i i i将其分为 S [ 1 , i ] S[1,i] S[1,i] S [ i + 1 , n ] S[i+1,n] S[i+1,n]两部分,问这两部分共有多少本质不同的字符串,对每个 i ∈ [ 1 , n − 1 ] i\in[1,n-1] i[1,n1]都要求答案。
n ≤ 200000 n\le200000 n200000

题目分析:

求出每种字符串最早出现的位置 L L L和最晚出现的位置 R R R,记它的长度为 l e n len len,那么对于 i ∈ [ R − l e n + 1 , L − 1 ] i\in[R-len+1,L-1] i[Rlen+1,L1],不同的字符串总数就会减1。

用后缀自动机实现这个问题,对每个 e n d p o s endpos endpos集合求出最左边的位置和最右边的位置,它的长度范围是 [ l e n [ f a [ i ] ] + 1 , l e n [ i ] ] [len[fa[i]]+1,len[i]] [len[fa[i]]+1,len[i]],那么对应到区间上就是一个等差数列和一个区间加( 1 , 2 , 3 , . . . k − 1 , k , k , k 1,2,3,...k-1,k,k,k 1,2,3,...k1,k,k,k的形式)。记一下差分数组 f f f以及差分数组的差分数组 g g g最后扫一遍即可。

具体来说如果要加的区间为 [ l , r ] [l,r] [l,r],加的值为 1 , 2 , 3... , k − 1 , k , k , k . . . 1,2,3...,k-1,k,k,k... 1,2,3...,k1,k,k,k...,那么就令 g [ l ] + = 1 , g [ l + k ] − = 1 , f [ r + 1 ] − = k g[l]+=1,g[l+k]-=1,f[r+1]-=k g[l]+=1,g[l+k]=1,f[r+1]=k,那么每个位置最终的差分 d [ i ] d[i] d[i]就是 f [ i ] + ∑ j = 1 i g [ j ] f[i]+\sum_{j=1}^i g[j] f[i]+j=1ig[j],每个位置原本的值就是 ∑ j = 1 i d [ j ] \sum_{j=1}^i d[j] j=1id[j]。实现的时候用两个数组 f , g f,g f,g即可。

Code:

#include<bits/stdc++.h>
#define maxn 400005
using namespace std;
const int mod = 1e9+7;
int T,n,id[maxn],f[maxn],g[maxn];
int fa[maxn],ch[maxn][10],len[maxn],L[maxn],R[maxn],last,sz;
char s[maxn];
void extend(int c,int pos){
	int cur=++sz,p=last,q; len[last=cur]=len[p]+1, L[cur]=R[cur]=pos;
	for(;p!=-1&&!ch[p][c];p=fa[p]) ch[p][c]=cur;
	if(p==-1) fa[cur]=0;
	else if(len[q=ch[p][c]]==len[p]+1) fa[cur]=q;
	else{
		int clone=++sz; len[clone]=len[p]+1,memcpy(ch[clone],ch[q],sizeof ch[q]);
		fa[clone]=fa[q],fa[cur]=fa[q]=clone,L[clone]=R[clone]=pos;
		for(;p!=-1&&ch[p][c]==q;p=fa[p]) ch[p][c]=clone;
	}
}
bool cmp(int i,int j){return len[i]<len[j];}
int main()
{
	scanf("%d",&T);
	while(T--){
		scanf("%d%s",&n,s+1);
		fa[0]=-1,memset(ch,0,(sz+1)*10<<2),last=sz=0;
		for(int i=1;i<=n;i++) extend(s[i]-'0',i);
		for(int i=1;i<=sz;i++) id[i]=i;
		sort(id+1,id+1+sz,cmp);
		for(int j=sz,i;j>=1;j--) i=id[j],L[fa[i]]=min(L[fa[i]],L[i]),R[fa[i]]=max(R[fa[i]],R[i]);
		memset(f,0,(sz+1)<<2),memset(g,0,(sz+1)<<2);
		for(int i=1;i<=sz;i++) if(R[i]-len[i]+1<L[i]){
			int k=min(L[i]-1,R[i]-len[fa[i]]);
			g[R[i]-len[i]+1]++,g[k+1]--;
			f[L[i]]-=k-(R[i]-len[i]);
		}
		int ans=0,sum=0;
		for(int i=1;i<=sz;i++) sum=(sum+len[i]-len[fa[i]])%mod;
		for(int i=1;i<n;i++) g[i]+=g[i-1],f[i]=(f[i]+f[i-1]+g[i])%mod,ans=(ans*100013ll+sum-f[i])%mod;
		printf("%d\n",(ans+mod)%mod);
	}
}
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值