1 是什么?
简而言之,就是在KMP算法的思想上加上trie树来实现的一个适合多个模式串的匹配问题。KMP算法时间复杂度优秀的原因是有一个next数组,也叫做失配指针数组,使得匹配的时间复杂度严格
O
(
M
+
N
)
O(M+N)
O(M+N),AC自动机也有这样的数组来在失配的时候去跳到相应应该去的地方。所以,AC自动机分两步:
1.建立trie树存下模式串
2.创造next失配指针
2-1如何建立trie树?
trie树,就是把字符串像一棵树一样的存起来的数据结构,减少了需要的空间,也减少查询的时间复杂度。
代码实现
int cntN=0;//节点个数
void Insert_String(char st[]){
int len=strlen(st),now=0;
for(int i=0;i<len;i++){
if(trie[now].nxt[st[i]-'a']==0){
trie[now].nxt[st[i]-'a']=++cntN;//没有就新建一个节点
}
now=trie[now].nxt[st[i]-'a'];
}
trie[now].cnt++;//最后cnt统计单词个数
}
2-2 如何创造失配指针?
我们用BFS的形式去创造失配指针。
根节点直接连着的结点的失配指针都指向根节点。
再下面的结点,就指向父亲的fail的与其相同结点,如果父亲的fail没有与其相同的结点,当然就指向根了。
void Make_Fail(){
queue<int> q;
for(int i=0;i<kind;i++){
if(trie[root].nxt[i]){
trie[trie[root].nxt[i]].fail=0;
q.push(trie[root].nxt[i]);
}
}
while(!q.empty()){
int u=q.front();
q.pop();
for(int i=0;i<kind;i++){
if(trie[u].nxt[i]){
trie[trie[u].nxt[i]].fail=trie[trie[u].fail].nxt[i];
q.push(trie[u].nxt[i]);
}
else{
trie[u].nxt[i]=trie[trie[u].fail].nxt[i];
}
}
}
}
2-3 如何匹配?
不用多说了。
int Match(char st[]){
int len=strlen(st),now=0,res=0;
for(int i=0;i<len;i++){
now=trie[now].nxt[st[i]-'a'];
for(int t=now;t!=root && trie[t].cnt!=-1;t=trie[t].fail){
res+=trie[t].cnt;
trie[t].cnt=-1;
}
}
return res;
}
3 整体代码参考
#include <cstdio>
#include <iostream>
#include <cstring>
#include <queue>
#define maxl 1000010
#define kind 26
#define root 0
using namespace std;
int n;
char s[maxl];
struct node{
int fail;
int nxt[kind];
int cnt;
}trie[maxl];
int cntN=0;
void Insert_String(char st[]){
int len=strlen(st),now=0;
for(int i=0;i<len;i++){
if(trie[now].nxt[st[i]-'a']==0){
trie[now].nxt[st[i]-'a']=++cntN;
}
now=trie[now].nxt[st[i]-'a'];
}
trie[now].cnt++;
}
void Make_Fail(){
queue<int> q;
for(int i=0;i<kind;i++){
if(trie[root].nxt[i]){
trie[trie[root].nxt[i]].fail=0;
q.push(trie[root].nxt[i]);
}
}
while(!q.empty()){
int u=q.front();
q.pop();
for(int i=0;i<kind;i++){
if(trie[u].nxt[i]){
trie[trie[u].nxt[i]].fail=trie[trie[u].fail].nxt[i];
q.push(trie[u].nxt[i]);
}
else{
trie[u].nxt[i]=trie[trie[u].fail].nxt[i];
}
}
}
}
int Match(char st[]){
int len=strlen(st),now=0,res=0;
for(int i=0;i<len;i++){
now=trie[now].nxt[st[i]-'a'];
for(int t=now;t!=root && trie[t].cnt!=-1;t=trie[t].fail){
res+=trie[t].cnt;
trie[t].cnt=-1;
}
}
return res;
}
int main(){
scanf("%d",&n);
for(int i=1;i<=n;i++){
scanf("%s",s);
Insert_String(s);
}
Make_Fail();
scanf("%s",s);
printf("%d",Match(s));
return 0;
}