蒟蒻最近想学个AC自动机简直被网上的板子搞疯了,随便点开一个都是带指针的,然而平时用到指针的时候并不多,看到这些代码也完全是看不懂的状态。只好在大概理解后自己脑补(yy)了一下AC自动机的代码,居然还过了,这里对学到的东西做一点小小的总结。顺便造福一下跟我之前一样没有学过AC自动机并且不会用指针的Oier,给出一段不带指针的板子。
【算法理解】
AC自动机的模型很好理解,就是在Trie树上做类似于KMP的操作。所以说在AC自动机里也会有一个类似于 next 数组的东西------ fail 数组来作为失配指针。它指向的 目标结点所代表的字符串 是 当前结点所代表的字符串 的最长后缀。
到这里,大概就能看出该算法的基本用途。AC自动机兼顾了 Trie树 和 KMP 的优点,多用来解决多模式串的匹配问题,即给你许多个模式串,问你这些模式串在给出的文本串里的出现情况。一般来说,AC自动机的复杂度为O(n+m),n为匹配串即文本串的长度,m为模式串的总长。在运用AC自动机时大致分为这几个步骤:建一棵 Trie树 把题目给出的模式串存入;然后建立自动机,即生成 fail 数组,一般采用 BFS 来实现这一步(在建立自动机时,我们不仅计算了 fail 数组,同时还确定了结点之间的父子关系。对于一个结点 i ,它的 fail ,即为它父亲的 fail 所对应的子结点。对于一个结点 i ,它孩子的 fail (如果该孩子在建立自动机前为空),即为 它一直失配直到找到一个存在的对应的子结点);最后一步直接将文本串放在自动机上跑就行,原理和KMP一样。
【算法模板】
#include<bits/stdc++.h>
using namespace std;
const int Max=10001;
struct Tree{
int fail,end;
int vis[26];
void clear(){
memset(vis,0,sizeof(vis));
fail=end=0;
}
}AC[Max];
int ans[Max],cnt=0;
char s[Max+5][Max+5];
void init(char c[],int num){
int len=strlen(c),now=0;
for(int i=0;i<len;i++){
int idx=c[i]-'a';
if(!AC[now].vis[idx]) AC[now].vis[idx]=++cnt;
now=AC[now].vis[idx];
}
AC[now].end=num;
}
void build_fail(){
queue<int>q;
for(int i=0;i<26;i++)
if(AC[0].vis[i]){
AC[AC[0].vis[i]].fail=0;
q.push(AC[0].vis[i]);
}
while(!q.empty()){
int cur=q.front();
q.pop();
for(int i=0;i<26;i++){
if(AC[cur].vis[i]){
AC[AC[cur].vis[i]].fail=AC[AC[cur].fail].vis[i];
q.push(AC[cur].vis[i]);
}
else AC[cur].vis[i]=AC[AC[cur].fail].vis[i];
}
}
}
void query(char c[]){
int len=strlen(c),now=0;
for(int i=0;i<len;i++){
now=AC[now].vis[c[i]-'a'];
for(int x=now;x;x=AC[x].fail) ans[AC[x].end]++;
}
}
int main()
{
int n;
while(scanf("%d",&n)){
if(!n) break;
memset(ans,0,sizeof(ans));
AC[0].clear();
for(int i=1;i<=n;i++){
scanf("%s",&s[i]);
init(s[i],i);
}
AC[0].fail=0;
build_fail();
scanf("%s",&s[0]);
query(s[0]);
for(int i=1;i<=n;i++) printf("%s %d\n",s[i],ans[i]);
}
return 0;
}
【算法题目】
HDU 2222 Keywords Search(丝毫不加掩饰的板子题)
HDU 3065 病毒侵袭持续中(注意这道题,输入有多组数据,题目中没说)
题解:http://www.cnblogs.com/Hero-of-someone/p/7157408.html