算法笔记 :AC自动机
前置学习要点:1 KMP 2 Trie
用途
用于多个模式串匹配,通常给你多个模式串和一个待匹配字符串,问字符串中出现了几次模式串
为什么用AC自动机
用KMP算法多次匹配也行,但复杂度很高,就想有没有一次匹配就能得到答案的方法
基本思想
简述版: 把KMP算法应用到Trie上
把待匹配的字符串一个个与Trie上的字母对比,如果存在该字母,则一路往下匹配,当找到一个单词时记录,如果没找到单词 ,则回到该字母fail指针所指向的位置
那么fail指针是什么: 其实就是KMP算法中失配的next数组,是不过fail指针是在树上跳跃,next数组在一个字符串间跳跃;
实现思路
1 根据模式串建立Trie
2初始话fail数组
基本思路:bfs 一层层构建数组
2.1 让第一层的字母进入队列,并让fail数组指向根节点
2.2 一层层处理,每个节点从a循环到z,若存在节点,则是fail指向父亲的fail指针的儿子(该儿子是与该字母一致),若不存在该节点,则fail指向根节点
3 匹配,就是基本思路,在Trie一个个匹配字母,匹配到字母就继续,匹配不到就跟下个节点等于fail数组
P3808 【模板】AC自动机
#include<bits/stdc++.h>
using namespace std;
const int N = 1e6+7;
int trie[N][26]; //字典树代表节点i的儿子j字母的节点编号
int val[N]; //附加信息
int fail[N]; //失配指针
int cnt = 0; //字典树节点的编号
int f(char s){return s-'a';}
void insert(string s) //建立trie
{ int u = 0; //从根节点开始遍历
int ch;
for(int i=0;i<s.length();i++){ //遍历所有的字母
ch = f(s[i]);
if(trie[u][ch]==0){
trie[u][ch] = ++cnt;
// printf("%d %d %d",u,ch,cnt);
}//不存在就创建新节点
u = trie[u][ch]; //更新父亲节点
}
val[u]++; //在叶子标记为单词末尾
//if(val[u]) cout<<val[u]<<" "<<u<<" ";
}
void init_fail(){ //bfs遍历
int u = 0;
queue<int> q;
fail[u] = 0;
for(int i = 0;i<26;i++){ //先把第一层的所有字母放入队列
if(trie[u][i]) {
fail[trie[u][i]] = u;
q.push(trie[u][i]);
}
}
while(!q.empty()){ //类似bfs
int rt = q.front();
q.pop();
for(int i =0;i<26;i++){
if(trie[rt][i]){
fail[trie[rt][i]] = trie[fail[rt]][i];
// 节点的失败指针指向(((他父亲节点)的失败指针所指向的那个节点)的下一个节点)
q.push(trie[rt][i]);
}
else trie[rt][i] = trie[fail[rt]][i];
}
}
}
int ask(string s){
int u = 0;
int ans = 0;
int ch;
for(int i=0;i<s.length();i++){
ch = f(s[i]);
// cout<<ch<<" ";
//printf("%d %d\n",u,ch);
if(trie[u][ch]){
if(val[trie[u][ch]]) {
ans+=val[trie[u][ch]];
val[trie[u][ch]] = 0;
//cout<<ans<<endl;
}
u = trie[u][ch];
}
else {
u = fail[trie[u][ch]];
}
}
return ans ;
}
int main(){
int n;
cin>>n;
while(n--){
string s;
cin>>s;
insert(s);
}
init_fail();
string k;
cin>>k;
cout<<ask(k)<<endl;
return 0;
}