https://ac.nowcoder.com/acm/problem/20443
https://www.luogu.org/problemnew/show/P3966
题意:给出n个单词,一篇文章由这n个单词组成,问每个单词在文中的串出现的次数,其中包括自己本身。
首先:每一个字符串建Trie然后,建立fail的指针,一个串要在其他串出现过,必定是另一个串的前缀的后缀形式出现的,我们在建立Trie时,记录每一个串的末尾的,在每一个串的每一个字符都赋值为1,表示他的一个前缀,有多少点能通过fail能跳到他,说明他就在哪些串的前缀中出现过,所以建立一颗fail树,求出每一个串的结尾的点的子树的权值就是答案,你画一个图就知道了
例如 ab b bb abc
建立AC自动机后如图,红色的是权值,就是出现的次数。
、
建立fail树后,蓝色表示权值,红色是结点id,例如b出现的次数 b的id为3的子树的权值就是5
bb的结尾的id是4权值就是1
#include<bits/stdc++.h>
using namespace std;
const int MAXN=1e6+10;
int nxt[MAXN][26],fail[MAXN],tot,now;
int p[210],sum[MAXN];
void Insert(char *s,int id)
{
int len=strlen(s);
now=0;
for(int i=0;i<len;i++)
{
int x=s[i]-'a';
if(!nxt[now][x]) nxt[now][x]=++tot;
now=nxt[now][x];
sum[now]++;
}
p[id]=now;
}
void build()
{
queue<int>qu;
for(int i=0;i<26;i++)
{
if(nxt[0][i]!=0) qu.push(nxt[0][i]);
}
while(!qu.empty())
{
int u=qu.front();qu.pop();
for(int i=0;i<26;i++)
{
if(nxt[u][i]!=0) fail[nxt[u][i]]=nxt[fail[u]][i],qu.push(nxt[u][i]);
else nxt[u][i]=nxt[fail[u]][i];
}
}
}
vector<int>vec[MAXN];
void dfs(int u)
{
for(int i=0;i<vec[u].size();i++)
{
int v=vec[u][i];
dfs(v);
sum[u]+=sum[v];
}
}
int n,ans[MAXN];
char tmp[MAXN];
int main()
{
ios::sync_with_stdio(false);
cin.tie(0);
cout.tie(0);
memset(fail,0,sizeof(fail));
memset(nxt,0,sizeof(nxt));
cin>>n;tot=0;
for(int i=1;i<=n;i++)
cin>>tmp,Insert(tmp,i);
build();
for(int i=1;i<=tot;i++) vec[fail[i]].push_back(i);
dfs(0);
for(int i=1;i<=n;i++) cout<<sum[p[i]]<<endl;
return 0;
}