AC自动机总结及板子(不带指针)

   蒟蒻最近想学个AC自动机简直被网上的板子搞疯了,随便点开一个都是带指针的,然而平时用到指针的时候并不多,看到这些代码也完全是看不懂的状态。只好在大概理解后自己脑补(yy)了一下AC自动机的代码,居然还过了,这里对学到的东西做一点小小的总结。顺便造福一下跟我之前一样没有学过AC自动机并且不会用指针的Oier,给出一段不带指针的板子。

   AC自动机的模型很好理解,就是在Trie树上做类似于KMP的操作。所以说在AC自动机里也会有一个类似于 next 数组的东西------ fail 数组来作为失配指针。它指向的 目标结点所代表的字符串 是 当前结点所代表的字符串 的最长后缀。

   到这里,大概就能看出该算法的基本用途。AC自动机兼顾了 Trie树 和 KMP 的优点,多用来解决多模式串的匹配问题,即给你许多个模式串,问你这些模式串在给出的文本串里的出现情况。一般来说,AC自动机的复杂度为O(n+m),n为匹配串即文本串的长度,m为模式串的总长。在运用AC自动机时大致分为这几个步骤:建一棵 Trie树 把题目给出的模式串存入;然后建立自动机,即生成 fail 数组,一般采用 BFS 来实现这一步(在建立自动机时,我们不仅计算了 fail 数组,同时还确定了结点之间的父子关系。对于一个结点 i ,它的 fail ,即为它父亲的 fail 所对应的子结点。对于一个结点 i ,它孩子的 fail (如果该孩子在建立自动机前为空),即为 它一直失配直到找到一个存在的对应的子结点);最后一步直接将文本串放在自动机上跑就行,原理和KMP一样。
 

#include<iostream>
#include<cstdlib>
#include<cstdio>
#include<cstring>
#include<queue>
#include<algorithm>
#define il inline
#define RG register
#define N 10010
using namespace std;

char s[N][55],ss[N*100];
int n,times[N];//times记录单词在文本串中出现的次数 

struct Trie{
  int son[N][26],fail[N],root,L,num[N];
  int last[N];//只是一个优化,有没有都没关系
   
  void init(){ 
    L=1; root=0; 
    memset(son,0,sizeof(son));
    memset(num,0,sizeof(num));
    memset(last,0,sizeof(last));
    memset(fail,0,sizeof(fail));
  }
   
  il int idx(char c){ return c-'a'; }
   
  void insert( char s[],int v ){
    int len=strlen(s), cur=root;
    for(int i=0;i<len;i++){
      int id=idx(s[i]);
      if(!son[cur][id])
        son[cur][id]=L++;
      cur=son[cur][id];
    }
    num[cur]=v;   //记录单词编号
  }
   
  void build(){
    int que[N],hd=0,tl=0;
    for(int i=0;i<26;i++)
      if(son[root][i]){
        que[tl++]=son[root][i];
        fail[son[root][i]]=root;
      }
      else son[root][i]=root;
      
    while(hd<tl){
      int cur=que[hd++];
      for(int i=0;i<26;i++){
        int Son=son[cur][i];
        if(Son){
          int f=fail[cur];
          while(f && !son[f][i]) f=fail[f];
          fail[Son]=son[f][i];
          //num[Son]=num[fail[Son]];//不要管这一句
          que[tl++]=Son;
        }
        else son[cur][i]=son[fail[cur]][i];
      }
      //if( num[fail[cur]] )last[cur]=fail[cur];
      //else last[cur]=last[fail[cur]];
    }
  }

  void query( char s[] ) {
    int len=strlen(s),cur=root;
    for(int i=0;i<len;i++){
      int id=idx(s[i]);
      while(cur && !son[cur][id]) cur=fail[cur];
      if(son[cur][id]){
        cur=son[cur][id];
        int k=cur;
        while(k) times[ num[k] ]++,k=fail[k];
        /*while(k){
          if(num[k]) times[num[k]]++;
          k=last[k];
          }*/
      }
    		
    }
  }
   
}AC;

int main(){
  scanf("%d",&n); AC.init();
  for(RG int i = 1;i<=n;i++){
    scanf("%s",s[i]);
    AC.insert(s[i],i);
  }
  AC.build();
  scanf("%s",ss); AC.query(ss);
  for( RG int i=1;i<=n;i++ )    printf("%s %d\n",s[i],times[i]);
  return 0;
}

 

 

 

    最后给推荐几道简单的AC自动机的练手题:

   HDU 2222 Keywords Search(丝毫不加掩饰的板子题)

   HDU 2896 病毒侵袭

   HDU 3065 病毒侵袭持续中(注意这道题,输入有多组数据,题目中没说)

   HDU 4117 GRE Words

   HDU 4787 GRE Words Revenge               题解:http://www.cnblogs.com/Hero-of-someone/p/7157408.html

   HDU 2296 Ring

 

 

   

转载于:https://www.cnblogs.com/Hero-of-someone/p/7147494.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值