Description
某人读论文,一篇论文是由许多单词组成。但他发现一个单词会在论文中出现很多次,现在想知道每个单词分别在论文中出现多少次。
题解:
建AC自动机,对于每个单词,建的时候在路径上的每个点+1,表示这个前缀出现了一次;对于后缀,直接在每个点的fail上加上这个点上的出现次数就好了。
Update:
也可以用广义后缀自动机做,直接建出广义后缀自动机,然后统计
right
r
i
g
h
t
集合大小即可,但是不能像普通后缀自动机那样搞拓扑序,不然会出事。
代码:
AC自动机
#include<cstdio>
#include<cstring>
#include<iostream>
#include<algorithm>
#include<queue>
using namespace std;
const int maxn=1000005;
struct Trie{int son[27],fail,sum;}tr[211000];
bool mark[211000];
int n,z=0,Q[maxn],head=0,h[maxn],lh=0;
char str[maxn];
void Clear(int x)
{
tr[x].fail=0;
for(int i=0;i<26;i++)tr[x].son[i]=-1;
}
void Build_Trie()
{
int len=strlen(str),now=0;
for(int i=0;i<len;i++)
{
int x=str[i]-'a';
if(tr[now].son[x]==-1)tr[now].son[x]=++z,Clear(z);
now=tr[now].son[x];
tr[now].sum++;
}
h[++lh]=now;
}
queue<int>q;
void work()
{
q.push(0);Q[++head]=0;
while(!q.empty())
{
int x=q.front();q.pop();
for(int i=0;i<26;i++)
{
int Son=tr[x].son[i],Fail=tr[x].fail;
if(Son>=0)
{
if(!x)tr[Son].fail=0;
else tr[Son].fail=tr[Fail].son[i];
q.push(Son);Q[++head]=Son;
}
else if(!x)tr[x].son[i]=0;
else tr[x].son[i]=tr[Fail].son[i];
}
}
for(int i=head;i;i--)
{
int x=Q[i];
tr[tr[x].fail].sum+=tr[x].sum;
}
for(int i=1;i<=lh;i++)
printf("%d\n",tr[h[i]].sum);
}
int main()
{
Clear(0);
scanf("%d",&n);
for(int i=1;i<=n;i++)
{
scanf("%s",str);
Build_Trie();
}
work();
}
广义后缀自动机:
#include<bits/stdc++.h>
using namespace std;
#define LL long long
#define pa pair<int,int>
const int Maxn=2000010;
const int inf=2147483647;
int read()
{
int x=0,f=1;char ch=getchar();
while(ch<'0'||ch>'9'){if(ch=='-')f=-1;ch=getchar();}
while(ch>='0'&&ch<='9')x=(x<<3)+(x<<1)+(ch^48),ch=getchar();
return x*f;
}
int tot=1,last;
int son[Maxn][26],par[Maxn],mx[Maxn];
int deg[Maxn];
int Right[Maxn];
void extend(int x)
{
int p=last,np=++tot;mx[np]=mx[p]+1;Right[np]=1;
while(p&&!son[p][x])son[p][x]=np,p=par[p];
if(!p)par[np]=1;
else
{
int q=son[p][x];
if(mx[p]+1==mx[q])par[np]=q;
else
{
int nq=++tot;mx[nq]=mx[p]+1;
for(int i=0;i<26;i++)son[nq][i]=son[q][i];
par[nq]=par[q];
par[q]=par[np]=nq;
while(son[p][x]==q)son[p][x]=nq,p=par[p];
}
}last=np;
}
char s[100010];
string str[210];
int len[210];
int main()
{
int n=read(),mxlen=-1;
for(int i=1;i<=n;i++)
{
scanf("%s",s);str[i]=s;
len[i]=strlen(s);
mxlen=max(mxlen,len[i]);
last=1;
for(int j=0;j<len[i];j++)extend(s[j]-'a');
}
queue<int>q;
for(int i=2;i<=tot;i++)deg[par[i]]++;
for(int i=1;i<=tot;i++)if(!deg[i])q.push(i);
while(!q.empty())
{
int x=q.front();q.pop();
Right[par[x]]+=Right[x];
if(!(--deg[par[x]]))q.push(par[x]);
}
for(int i=1;i<=n;i++)
{
int now=1;
for(int j=0;j<len[i];j++)now=son[now][str[i][j]-'a'];
printf("%d\n",Right[now]);
}
}