一、步骤
Step1:建Trie
Step2:bfs求fail和last,并补全Trie
Step3:Find
二、维护:
fail[u] 失配时针
last[u] 沿着fail跳到的下一个单词节点
三、注意:
①多组数据的初始化:
trie[0][i] = 1;
trie[1][i] = 0;
②补全Trie树以后,Find的时候不需要while(!Trie[u][t]) u = fail[u]了,(!Trie[u][t]这种情况不可能出现)
③点u代表的单词出现了,代表所有通过fail[u]能访问到的单词也出现了,统计的时候不要遗漏。
单词节点会沿着fail指针传递。
也就是:走到一个非单词节点u,也有可能成功匹配某个串,因为u沿着fail指针可能会跳转到单词节点。
【使用手写queue,用做完的que数组的“逆序”更新】
for(int i=cnt; i; --i)
{
int u = que[i];
times[last[u]] += times[u];
}
④遇到AC自动机:要想到这个坑点:有没有可能有两个相同的串被扔到Trie树上 (看清楚题目:相同的单词到底算一遍还是多遍)
四、模板题 hdu2222
#include<queue>
#include<cstdio>
#include<cstring>
#include<iostream>
#include<algorithm>
#define N 500005
#define INF 0x3f3f3f3f
using namespace std;
int trie[N][28];
int fail[N];
int last[N];
int val[N];
int times[N];
int root=1, cnt=1;
char s[1000010];
char ch[1000010];
int que[N];
int idx(char c)
{
return c - 'a' + 1;
}
void insert(char *ch)
{
int n = strlen(ch);
int u = root;
for(int i=0; i<n; ++i)
{
int t = idx(ch[i]);
if(!trie[u][t])
{
trie[u][t] = ++cnt;
for(int i=1; i<=26; ++i) // 多组数据的初始化
trie[cnt][i] = 0;
}
u = trie[u][t];
}
val[u]++;
}
void bfs()
{
int ql = 1, qr = 1;
que[1] = 1;
while(ql <= qr)
{
int u = que[ql++];
for(int i=1; i<=26; ++i)
if(trie[u][i])
{
int v = trie[u][i];
que[++qr] = v;
fail[v] = trie[fail[u]][i];
last[v] = val[fail[v]] ? fail[v] : last[fail[v]];
}
else trie[u][i] = trie[fail[u]][i];
}
}
void Find(char *ch)
{
int n = strlen(ch);
int u = root;
for(int i=0; i<n; ++i)
{
int t = idx(ch[i]);
u = trie[u][t];
++times[u];
}
}
int main()
{
int T;
scanf("%d", &T);
while(T--)
{
root = 1; // 多组数据的初始化
cnt = 1; // 多组数据的初始化
for(int i=1; i<=26; ++i)
{
trie[0][i] = 1;
trie[1][i] = 0;
}
int n;
scanf("%d", &n);
for(int i=1; i<=n; ++i)
{
scanf("%s", ch);
insert(ch);
}
bfs();
scanf("%s", s);
Find(s);
for(int i=cnt; i; --i)
{
int u = que[i];
times[last[u]] += times[u];
}
int ans = 0;
for(int i=1; i<=cnt; ++i)
if(times[i] && val[i])
ans += val[i];
printf("%d\n", ans);
for(int i=1; i<=cnt; ++i) fail[i] = last[i] = val[i] = times[i] = 0; // 多组数据的初始化
}
}