题意:给定一个字符串 S S S和 m m m个区间 [ l i , r i ] [l_i,r_i] [li,ri], q q q次询问,每次给定长度为 k k k的字符串 w w w和区间 [ a , b ] [a,b] [a,b],求对于所有 i ∈ [ a , b ] i\in[a,b] i∈[a,b], w w w在 [ l i , r i ] [l_i,r_i] [li,ri]内的子串在 S S S中出现次数之和。
∣ S ∣ , m , ∑ ∣ w ∣ ≤ 1 0 5 |S|,m,\sum|w|\leq10^5 ∣S∣,m,∑∣w∣≤105
看上去很不可做,但是有一个很难注意到的特殊性质:所有 w w w串长相等,所以 k q ≤ 1 0 5 kq\leq10^5 kq≤105。后面记 k q = w kq=w kq=w
所以 k , q k,q k,q中的较小值是根号级别的,考虑数据分治
首先肯定要先建出 S S S的后缀自动机
当 k < q k<q k<q时,字符串很短,直接开 k 2 k^2 k2个vector记录所有区间出现的位置,然后暴力枚举 w w w的子串,在对应的vector用 a a a和 b b b二分一下算出有多少个区间,乘上在后缀自动机上的size。复杂度 O ( q k 2 log n ) = O ( w w log n ) O(qk^2\log n)=O(w\sqrt w\log n) O(qk2logn)=O(wwlogn)
当 k > q k>q k>q时,询问很少,可以每次单独处理。每次读入 w w w后先预处理出 w w w的每个前缀 i i i 最长的 是 S S S的子串 的 后缀长度 L i L_i Li。
然后暴力把 [ a , b ] [a,b] [a,b]中的区间挂到 r r r上,从左到右扫一遍,设当前处理 [ l , r ] [l,r] [l,r],如果 L r < r − l + 1 L_r<r-l+1 Lr<r−l+1,说明这个子串没有出现过,直接跳过;否则在fail树上倍增找到最靠上的满足 l e n p ≥ r − l + 1 len_p\geq r-l+1 lenp≥r−l+1的结点 p p p,这个子串就出现了 s i z p siz_p sizp次。复杂度 O ( q m log n ) = O ( m w log n ) O(qm\log n)=O(m\sqrt w\log n) O(qmlogn)=O(mwlogn)
某个 k = q k=q k=q的点用SOLVE2会卡常,所以特判成了SOLVE1
#include <iostream>
#include <cstdio>
#include <cstring>
#include <cctype>
#include <vector>
#include <algorithm>
#define MAXN 200005
using namespace std;
int ch[MAXN][26],fa[MAXN],tot=1,las=1;
int len[MAXN],siz[MAXN];
void insert(int c)
{
int p=las,cur=++tot;
len[cur]=len[las]+1,las=cur;
for (;p&&!ch[p][c];p=fa[p]) ch[p][c]=cur;
if (!p) fa[cur]=1;
else
{
int q=ch[p][c];
if (len[q]==len[p]+1) fa[cur]=q;
else
{
int _q=++tot;
len[_q]=len[p]+1;
fa[_q]=fa[q],fa[q]=fa[cur]=_q;
memcpy(ch[_q],ch[q],sizeof(ch[q]));
for (;ch[p][c]==q;p=fa[p]) ch[p][c]=_q;
}
}
siz[cur]=1;
}
int a[MAXN],c[MAXN],up[MAXN][20];
inline void build(int n)
{
for (int i=1;i<=tot;i++) ++c[len[i]];
for (int i=1;i<=n;i++) c[i]+=c[i-1];
for (int i=tot;i;i--) a[c[len[i]]--]=i;
for (int i=1;i<=tot;i++)
{
up[a[i]][0]=fa[a[i]];
for (int j=1;j<20;j++) up[a[i]][j]=up[up[a[i]][j-1]][j-1];
}
for (int i=tot;i;i--) if (fa[a[i]]) siz[fa[a[i]]]+=siz[a[i]];
}
int n,m,k,q,l[MAXN],r[MAXN];
char s[MAXN],w[MAXN];
typedef long long ll;
namespace SOLVE1
{
vector<int> lis[405][405];
int pos[MAXN];
void main()
{
for (int i=1;i<=m;i++) lis[l[i]][r[i]].push_back(i);
while (q--)
{
int a,b;
scanf("%s%d%d",w+1,&a,&b);
++a,++b;
ll ans=0;
for (int i=1;i<=k;i++)
{
int now=1;
for (int j=i;j<=k;j++)
{
now=ch[now][w[j]-'a'];
if (!now) break;
ans+=(ll)siz[now]*(upper_bound(lis[i][j].begin(),lis[i][j].end(),b)-upper_bound(lis[i][j].begin(),lis[i][j].end(),a-1));
}
}
printf("%lld\n",ans);
}
}
}
namespace SOLVE2
{
vector<int> lis[MAXN];
int pos[MAXN],maxl[MAXN];
void main()
{
while (q--)
{
int a,b;
scanf("%s%d%d",w+1,&a,&b);
++a,++b;
ll ans=0;
int now=1,curl=0;
for (int i=a;i<=b;i++) lis[r[i]].push_back(l[i]);
for (int i=1;i<=k;i++)
{
while (now&&!ch[now][w[i]-'a']) now=fa[now],curl=len[now];
now=ch[now][w[i]-'a'],++curl;
if (!now) now=1,curl=0;
pos[i]=now,maxl[i]=curl;
}
for (int p=1;p<=k;p++)
for (int j=0;j<(int)lis[p].size();j++)
{
int u=pos[p],lim=p-lis[p][j]+1;
if (maxl[p]<lim) continue;
for (int i=19;i>=0;i--)
if (len[up[u][i]]>=lim)
u=up[u][i];
ans+=siz[u];
}
printf("%lld\n",ans);
for (int i=a;i<=b;i++) lis[r[i]].clear();
}
}
}
int main()
{
scanf("%d%d%d%d",&n,&m,&q,&k);
scanf("%s",s+1);
for (int i=1;i<=n;i++) insert(s[i]-'a');
build(n);
for (int i=1;i<=m;i++) scanf("%d%d",&l[i],&r[i]),++l[i],++r[i];
if (k<=q)
SOLVE1::main();
else
SOLVE2::main();
return 0;
}