【雅礼集训2017】字符串【后缀自动机】【数据分治】

题意:给定一个字符串 S S S m m m个区间 [ l i , r i ] [l_i,r_i] [li,ri], q q q次询问,每次给定长度为 k k k的字符串 w w w和区间 [ a , b ] [a,b] [a,b],求对于所有 i ∈ [ a , b ] i\in[a,b] i[a,b] w w w [ l i , r i ] [l_i,r_i] [li,ri]内的子串在 S S S中出现次数之和。

∣ S ∣ , m , ∑ ∣ w ∣ ≤ 1 0 5 |S|,m,\sum|w|\leq10^5 S,m,w105

看上去很不可做,但是有一个很难注意到的特殊性质:所有 w w w串长相等,所以 k q ≤ 1 0 5 kq\leq10^5 kq105。后面记 k q = w kq=w kq=w

所以 k , q k,q k,q中的较小值是根号级别的,考虑数据分治

首先肯定要先建出 S S S的后缀自动机

k < q k<q k<q时,字符串很短,直接开 k 2 k^2 k2个vector记录所有区间出现的位置,然后暴力枚举 w w w的子串,在对应的vector用 a a a b b b二分一下算出有多少个区间,乘上在后缀自动机上的size。复杂度 O ( q k 2 log ⁡ n ) = O ( w w log ⁡ n ) O(qk^2\log n)=O(w\sqrt w\log n) O(qk2logn)=O(ww logn)

k > q k>q k>q时,询问很少,可以每次单独处理。每次读入 w w w后先预处理出 w w w的每个前缀 i i i 最长的 是 S S S的子串 的 后缀长度 L i L_i Li

然后暴力把 [ a , b ] [a,b] [a,b]中的区间挂到 r r r上,从左到右扫一遍,设当前处理 [ l , r ] [l,r] [l,r],如果 L r < r − l + 1 L_r<r-l+1 Lr<rl+1,说明这个子串没有出现过,直接跳过;否则在fail树上倍增找到最靠上的满足 l e n p ≥ r − l + 1 len_p\geq r-l+1 lenprl+1的结点 p p p,这个子串就出现了 s i z p siz_p sizp次。复杂度 O ( q m log ⁡ n ) = O ( m w log ⁡ n ) O(qm\log n)=O(m\sqrt w\log n) O(qmlogn)=O(mw logn)

某个 k = q k=q k=q的点用SOLVE2会卡常,所以特判成了SOLVE1

#include <iostream>
#include <cstdio>
#include <cstring>
#include <cctype>
#include <vector>
#include <algorithm>
#define MAXN 200005
using namespace std;
int ch[MAXN][26],fa[MAXN],tot=1,las=1;
int len[MAXN],siz[MAXN];
void insert(int c)
{
	int p=las,cur=++tot;
	len[cur]=len[las]+1,las=cur;
	for (;p&&!ch[p][c];p=fa[p]) ch[p][c]=cur;
	if (!p) fa[cur]=1;
	else
	{
		int q=ch[p][c];
		if (len[q]==len[p]+1) fa[cur]=q;
		else
		{
			int _q=++tot;
			len[_q]=len[p]+1;
			fa[_q]=fa[q],fa[q]=fa[cur]=_q;
			memcpy(ch[_q],ch[q],sizeof(ch[q]));
			for (;ch[p][c]==q;p=fa[p]) ch[p][c]=_q;
		}
	}
	siz[cur]=1;
}
int a[MAXN],c[MAXN],up[MAXN][20];
inline void build(int n)
{
	for (int i=1;i<=tot;i++) ++c[len[i]];
	for (int i=1;i<=n;i++) c[i]+=c[i-1];
	for (int i=tot;i;i--) a[c[len[i]]--]=i;
	for (int i=1;i<=tot;i++)
	{
		up[a[i]][0]=fa[a[i]];
		for (int j=1;j<20;j++) up[a[i]][j]=up[up[a[i]][j-1]][j-1];
	}
	for (int i=tot;i;i--) if (fa[a[i]]) siz[fa[a[i]]]+=siz[a[i]]; 
}
int n,m,k,q,l[MAXN],r[MAXN];
char s[MAXN],w[MAXN];
typedef long long ll;
namespace SOLVE1
{
	vector<int> lis[405][405];
	int pos[MAXN];
	void main()
	{
		for (int i=1;i<=m;i++) lis[l[i]][r[i]].push_back(i);
		while (q--)
		{
			int a,b;
			scanf("%s%d%d",w+1,&a,&b);
			++a,++b;
			ll ans=0;
			for (int i=1;i<=k;i++)
			{
				int now=1;
				for (int j=i;j<=k;j++)
				{
					now=ch[now][w[j]-'a'];
					if (!now) break;
					ans+=(ll)siz[now]*(upper_bound(lis[i][j].begin(),lis[i][j].end(),b)-upper_bound(lis[i][j].begin(),lis[i][j].end(),a-1));
				}
			}
			printf("%lld\n",ans);
		}
	}
}
namespace SOLVE2
{
	vector<int> lis[MAXN];
	int pos[MAXN],maxl[MAXN];
	void main()
	{
		while (q--)
		{
			int a,b;
			scanf("%s%d%d",w+1,&a,&b);
			++a,++b;
			ll ans=0;
			int now=1,curl=0;
			for (int i=a;i<=b;i++) lis[r[i]].push_back(l[i]);
			for (int i=1;i<=k;i++) 
			{
				while (now&&!ch[now][w[i]-'a']) now=fa[now],curl=len[now];
				now=ch[now][w[i]-'a'],++curl;
				if (!now) now=1,curl=0;
				pos[i]=now,maxl[i]=curl;
			}
			for (int p=1;p<=k;p++)
				for (int j=0;j<(int)lis[p].size();j++)
				{
					int u=pos[p],lim=p-lis[p][j]+1;
					if (maxl[p]<lim) continue;
					for (int i=19;i>=0;i--)
						if (len[up[u][i]]>=lim)
							u=up[u][i];
					ans+=siz[u];
				}
			printf("%lld\n",ans);
			for (int i=a;i<=b;i++) lis[r[i]].clear();
		}
	}
}
int main()
{
	scanf("%d%d%d%d",&n,&m,&q,&k);
	scanf("%s",s+1);
	for (int i=1;i<=n;i++) insert(s[i]-'a');
	build(n);
	for (int i=1;i<=m;i++) scanf("%d%d",&l[i],&r[i]),++l[i],++r[i];
	if (k<=q) 
		SOLVE1::main();
	else
		SOLVE2::main();
	return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值