介绍
AC自动机是kmp算法和trie树的结合
大体就是做这样的题用:
可以发现,这题和trie树的区别是把多个单词往一篇文章匹配,而trie恰好相反
匹配的时候其实就是判断子串,所以又用到了kmp
定义失配指针nxt[i]:表示root到nxt[i]结点的字符串是到 i 结点的字符串的在本树中的最长后缀(其实和kmp差不多啦)
设文章下一个字是s,当前trie树结点是a
每次发现a结点下方没有s的儿子(膝下无子 ) 就回去重新找失配指针
现在考虑处理失配指针
因为显然nxt[i]的深度小于i,所以采用bfs,从而保证当前结点以上的所有的结点的nxt都解决完
核心代码
void solve(){
for(int i=1;i<=26;i++) tree[0][i]=1;
int q[N]={};
q[1]=1;nxt[1]=0;
for(int st=1,ed=1;st<=ed;st++){
int now=q[st];
for(int i=1;i<=26;i++){
if(!tree[now][i]) tree[now][i]=tree[nxt[now]][i];
else{
q[++ed]=tree[now][i];
int v=nxt[now];
nxt[tree[now][i]]=tree[v][i];
}
}
}
}
看代码也可以发现,当tree[i][j]无定义时,直接指向了它的失配指针
然后就好办了
void ac(){
int p=1;
int l=strlen(s+1);
for(int i=1;i<=l;i++) a[i]=s[i]-'a'+1;
for(int i=1;i<=l;i++){
p=tree[p][a[i]];
int k=p;
while(k>1){//防止遗漏
ans+=end[k];
end[k]=0;//本题需要清零
k=nxt[k];
}
}
return;
}
例题代码
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<cmath>
#include<map>
#include<vector>
#include<queue>
#include<stack>
#include<deque>
#include<set>
#include<string>
#include<iostream>
#include<climits>
#define mem(a,b) memset(a,b,sizeof(a));
using namespace std;
const int M=1000050;
const int N=100050;
const int mod=100003;
typedef pair<int,int>pr;
int m,n,k,b,c,d;
int num=1,tree[N][28],end[M];
char s[M];
int a[M];
void add(){
int l1=strlen(s+1);
for(int i=1;i<=l1;i++) a[i]=s[i]-'a'+1;
int u=1;
for(int i=1;i<=l1;i++){
if(!tree[u][a[i]]) tree[u][a[i]]=++num;
u=tree[u][a[i]];
}
end[u]++;
}
int nxt[N];
void solve(){
for(int i=1;i<=26;i++) tree[0][i]=1;
int q[N]={};
q[1]=1;nxt[1]=0;
for(int st=1,ed=1;st<=ed;st++){
int now=q[st];
for(int i=1;i<=26;i++){
if(!tree[now][i]) tree[now][i]=tree[nxt[now]][i];
else{
q[++ed]=tree[now][i];
int v=nxt[now];
nxt[tree[now][i]]=tree[v][i];
}
}
}
}
int ans=0;
void ac(){
int p=1;
int l=strlen(s+1);
for(int i=1;i<=l;i++) a[i]=s[i]-'a'+1;
for(int i=1;i<=l;i++){
p=tree[p][a[i]];
int k=p;
while(k>1){
ans+=end[k];
end[k]=0;
k=nxt[k];
}
}
return;
}
int main(){
scanf("%d",&k);
while(k--){
mem(tree,0);mem(end,0);
ans=0;num=1;
scanf("%d",&n);
for(int i=1;i<=n;i++){
scanf("%s",s+1);
add();
}
scanf("%s",s+1);
solve();
ac();
printf("%d\n",ans);
}
}
/*
1
5
she
he
say
shr
her
yasherhs
*/