AC自动机概述

首先我们需要了解trie树。
我们把每个模式串逐个插入trie树。
比如说把a,aba,ac,cb四个串插入trie树,得到的是这样的:
这里写图片描述

对于trie树来说,我们从根开始到每一个结束节点(红色节点)的路径都代表一个字符串。为了减少状态我们把有相同前缀的字符串的前缀合并。插入时标出结束节点。

fail链:

在AC自动机中最重要的就是fail链了。fail链中文就是失配链。AC自动机不像后缀自动机一样,AC自动机构建出来就是用来匹配的。当我们用文本串进行匹配的时候,到达一个状态表示当前位置匹配的最长串。如果下一步没有转移了我们就要缩短当前的匹配长度再寻找转移。fail链应该指向在AC自动机出现的它的最长后缀。

构造:

当我们构造出一个trie树之后怎么构造一个AC自动机?其实很好理解,假如我知道父亲的fail链指向,只需要沿着父亲的fail链向上找有没有一个和自己一样的转移。如果有就连fail。因为可以遍历父亲串的在AC自动机里出现所有后缀串。

现在我们构造一下刚刚trie树的Ac自动机:
这里写图片描述

稍微讲一下算法流程:

bfs构图,可以做到先构造父亲载构造儿子,到达一个节点遍历所有儿子,每遍历一个儿子顺着fail链向上找有无转移即可。
注意root的儿子事先指向root。

一些小trick:

注意匹配到一个节点时它沿fail链向上的所有节点都会被匹配,所以可以在匹配之前先下推结束状态保证复杂度。

AC自动机只能离线构造,不支持在线插入,因为这样会打乱AC自动机的fail。但是可以利用分块的思想使复杂度降成 nn n n 。具体做法就是开AB两个后缀自动机,每次插入B自动机,当B中有 n n 个串之后把B并入A并清空B。查询就在AB里均匹配一次,把答案加起来即可。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python AC自动机是一个用于字符串匹配的算法,它可以高效地在一段文本中查找多个预定义的模式。它的实现可以使用多种库,其中包括ac自动机python和ahocorasick-python。 ac自动机python是一个对标准的ac自动机算法进行了完善和优化的实现,适用于主流的Python发行版,包括Python2和Python3。它提供了更准确的结果,并且可以通过pip进行安装,具体的安装方法可以参考官方文档或者使用pip install命令进行安装。 ahocorasick-python是另一个实现AC自动机的库,它也可以用于Python2和Python3。你可以通过官方网站或者GitHub源码获取更多关于该库的信息和安装指南。 对于AC自动机的使用,一个常见的例子是在一段包含m个字符的文章中查找n个单词出现的次数。要了解AC自动机,需要有关于模式树(字典树)Trie和KMP模式匹配算法的基础知识。AC自动机的算法包括三个步骤:构造一棵Trie树,构造失败指针和模式匹配过程。在构造好AC自动机后,可以使用它来快速地在文本中查找预定义的模式,并统计它们的出现次数。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [ahocorasick-python:AC自动机python的实现,并进行了优化。 主要修复了 查询不准确的问题](https://download.csdn.net/download/weixin_42122986/18825869)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* *3* [Python实现多模匹配——AC自动机](https://blog.csdn.net/zichen_ziqi/article/details/104246446)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值