AC自动机

AC自动机

AC自动机,刚学习ac自动机时,还真的以为能自动ac,ac自动机就是一种匹配多个字符串的高效的方法,如果要靠kmp来解决问题,那就要考k个n+m,这个太浪费时间,写写暴力还行,不能拿全分,但是想一想,他浪费时间浪费在每个字符串都要单个的求next数组,单个的与文章匹配,我们想一想,如果我们把这些单个化为一个整体,那就节省时间了,把字符串结合在一起的方法有很多,比如什么hash,trie树,而ac自动机就是建立在trie树上面的,而原来KMP的next数组变成了树的fail指针,流程其实挺简单的,由于细节在trie树和kmp已分析过,所以大概分析一下,建树还是一如既往。要加一个set_fail函数来查找每个节点的fail,这个过程要说一下,就是fail一直跳,知道不为空的节点或根,在把fail指向节点或根,这样做原因是什么?想想并查集,它的一个优化就是直接接一根线到祖先(路径压缩),可能有异曲同工之妙啊,接了fail的先以后就要做做后一步了,把文章放到自动机上跑一边,就是和trie找前缀过程有点像,总之,ac自动机作用相当打,在kmp上更上一层楼。下面配上代码。



#include<stdio.h>
#include<string.h>
#include<malloc.h>
#include<queue>
using namespace std;
char str[1000000+100];
struct node{
    int count;
    struct node *next[26];
    struct node *fail;
    void init(){
        for(int i = 0; i < 26; i++) next[i] = NULL;
        count = 0;
        fail = NULL;
    }
} *root;
void insert(){
    int len, k;
    node *p = root;
    len = strlen(str);
    for(k = 0; k < len; k++){
        int pos = str[k] - 'a';
        if( p->next[pos] == NULL ){
            p->next[pos] = new node;
            p->next[pos]->init();
            p = p->next[pos];
        }
        else
            p = p->next[pos];
    }
    p->count++;
}
void getfail()
{
    int i;
       node *p = root, *son, *temp;
       queue <struct node *> que;
       que.push(p); 
       while( !que.empty() ){
           temp = que.front();
           que.pop();
           for(i = 0; i < 26; i++){
               son = temp->next[i];
               if(son != NULL){
                   if(temp == root) {son->fail = root;}
                   else{
                       p = temp->fail;
                       while( p ) {
                           if(p->next[i]){
                               son->fail=p->next[i];
                               break;
                           }
                           p=p->fail;
                       }
                       if(!p)  son->fail=root;
                   }
                   que.push(son);
               }
           }
       }
}
void query()
{
    int len, i, cnt = 0;
    len = strlen(str);
    node *p, *temp;
    p = root;
    for( i = 0; i < len; i++)
    {
        int pos = str[i]-'a';
        while( !p->next[pos]&&p!=root )  p = p->fail;      
        p = p->next[pos];
        if( !p ) p=root;
        temp = p;
        while( temp!=root )
        {
            if(temp->count >= 0) 
            {
                cnt += temp->count;
                temp->count = -1;  
            }
            else break; 
            temp = temp->fail; 
        }
    }
    printf("%d\n",cnt);
}
int main()
{
    int cas,n;
    scanf("%d",&cas);
    while(cas--)
    {
        root=new node;
        root->init();
        root->fail=NULL;
        scanf("%d",&n);
        int i;
        getchar();
        for(i=0;i<n;i++)
        {
            gets(str);
            insert();
        }
        getfail();
        gets(str);
        query();
    }
    return 0;
}

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python AC自动机是一个用于字符串匹配的算法,它可以高效地在一段文本中查找多个预定义的模式。它的实现可以使用多种库,其中包括ac自动机python和ahocorasick-python。 ac自动机python是一个对标准的ac自动机算法进行了完善和优化的实现,适用于主流的Python发行版,包括Python2和Python3。它提供了更准确的结果,并且可以通过pip进行安装,具体的安装方法可以参考官方文档或者使用pip install命令进行安装。 ahocorasick-python是另一个实现AC自动机的库,它也可以用于Python2和Python3。你可以通过官方网站或者GitHub源码获取更多关于该库的信息和安装指南。 对于AC自动机的使用,一个常见的例子是在一段包含m个字符的文章中查找n个单词出现的次数。要了解AC自动机,需要有关于模式树(字典树)Trie和KMP模式匹配算法的基础知识。AC自动机算法包括三个步骤:构造一棵Trie树,构造失败指针和模式匹配过程。在构造好AC自动机后,可以使用它来快速地在文本中查找预定义的模式,并统计它们的出现次数。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [ahocorasick-python:AC自动机python的实现,并进行了优化。 主要修复了 查询不准确的问题](https://download.csdn.net/download/weixin_42122986/18825869)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* *3* [Python实现多模匹配——AC自动机](https://blog.csdn.net/zichen_ziqi/article/details/104246446)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值