题目:
题意:
给出n个原串,再给出m个查询串。求每个查询串出现在了多少原串中。
题解:
建立后缀自动机,所谓广义就是将几个串建立在同一个自动机上,每次加入一个新串的时候,将last恢复到root,然后其他照常做就可以了。
如何统计每个状态出现在了多少原串中呢?我们对于每个状态维护两个值size,nxt。nxt存储的是上一个到达这个状态的串是哪个原串,如果与当前的原串相同就不更新。如果不相同就size++。根据后缀自动机的性质,只要找到一个nxt等于当前的点,就可以不用再往前找了,因为前面的一定是短了或者是更新过了。
而且如果要匹配整个串的话,我们直接在后缀自动机上奔跑就可以了,并不需要像当时求最长公共子串那样小心翼翼的跳,要有就是有,没有拉倒
代码:
#include <cstdio>
#include <cstring>
using namespace std;
const int N=200005;
int p,np,q,nq,last,cnt,size[N],fa[N],ch[N][30],step[N],nxt[N];
char st[N];
void insert(int c,int Q)
{
p=last; np=last=++cnt;
step[np]=step[p]+1;
while (p&&!ch[p][c]) ch[p][c]=np,p=fa[p];
if (!p) fa[np]=1;
else
{
q=ch[p][c];
if (step[q]==step[p]+1) fa[np]=q;
else
{
nq=++cnt; step[nq]=step[p]+1;
memcpy(ch[nq],ch[q],sizeof(ch[q]));
nxt[nq]=nxt[q]; size[nq]=size[q];
不要忘记这里还新建了节点需要更新信息
fa[nq]=fa[q]; fa[q]=fa[np]=nq;
while (ch[p][c]==q) ch[p][c]=nq,p=fa[p];
}
}
for (;np;np=fa[np])
if (nxt[np]!=Q) nxt[np]=Q,size[np]++;
else break;
}
int main()
{
int n,m;scanf("%d%d",&n,&m);
cnt=1;
for (int i=1;i<=n;i++)
{
scanf("%s",st+1);
last=1;int l=strlen(st+1);
for (int j=1;j<=l;j++) insert(st[j]-'a',i);
}
while (m--)
{
scanf("%s",st+1);
p=1;int l=strlen(st+1);
for (int i=1;i<=l;i++) p=ch[p][st[i]-'a'];
printf("%d\n",size[p]);
}
}