AC自动机学习笔记

AC自动机


  • AC自动机是一种有限状态自动机,它常被用于多模式串的字符串匹配
  • AC自动机是以 Trie 的结构为基础,结合KMP的思想建立的
    KMP学习笔记
    Trie树学习笔记

实现

  • 基础的 Trie 结构:将所有的模式串构成一棵Trie
  • KMP的思想:对Trie树上所有的结点构造失配指针,并建成图

root:初始化的根

num:节点数量

mark[]:记录val值

fail[]:fail数组,跳转数组

struct Ac_Automaton {
	int root, num;			//根和节点数
	int tree[maxn][26];		//trie树节点
	int mark[maxn];			//记录mark
	int fail[maxn];			//fail数组
	Ac_Automaton() {		//初始化函数
		root = num = 0;
		memset(tree, 0, sizeof(tree));
		memset(mark, 0, sizeof(mark));
		memset(fail, 0, sizeof(fail));
	}
	void init() {			//清空函数
		memset(tree, 0, sizeof(int) * (num + 1) * 26);
		memset(mark, 0, sizeof(int) * (num + 1));
		memset(fail, 0, sizeof(int) * (num + 1));
		root = num = 0;
	}
}ac;

Trie 树构建

  • 用tire 树的插入操作构建 Trie 树
void insert(char* str) {
		int position = root;
		for (int i = 0; str[i]; i++) {
			int symbol = str[i] - 'a';	
			if (!tree[position][symbol])
				tree[position][symbol] = ++num;
			position = tree[position][symbol];
		}
		mark[position]++;	
	}

fail数组构造

特点
  • 在失配的时候用于跳转的指针
  • fail 数组跳转到最长真后缀的位置
  • fail 指针会在字典树上的结点来回穿梭
  • 每个点都只连出一条 fail 边,且连到的点对应的字符串长度更小,所以 fail 边构成了一棵 fail 树

实现

利用部分已经求出 fail 指针的结点,推导出当前结点的 fail 指针

实现方式为BFS

  • 如果 fail[p] 结点s 到 e 的边存在:

    • fail[p]指向的点指向e
    • 即在原本后缀相同的串内再加一个字符
  • 如果*fail[p]*结点s 到 e 的边不存在:

    • 继续寻找*fail[fail[p]]*指向的节点,重复上述过程,一直跳到根节点
    • 如果没有,令*fail[u] =*根节点

    如果真的模拟上述的过程BFS,想想复杂度就很高

    这时考虑像并查集一样做路径压缩

    void build() {
    	queue<int> q;
    	register int position;
    	for (int i = 0; i < 26; i++) if (tree[root][i]) q.push(tree[root][i]);
        //直接将根节点的子节点加入队列,因为fail[root]=0,他会自己指向自己
    	while (!q.empty()) {
    		position = q.front(); q.pop();
            //取出第一个fail指针
    		for (int i = 0; i < 26; i++) {
    			if (tree[position][i]) {	//若fail存在指向的点
    				fail[tree[position][i]] = tree[fail[position]][i];
                    //由于已经路径压缩,所以只需要一次跳转即可
    				q.push(tree[position][i]);
                    //将该位入队
    			}
    			else tree[position][i] = tree[fail[position]][i];
                //将他指向fail指针的fail[]指针指向的值,将不存在的点做路径压缩
    		}
    	}
    }
    

    多模式串匹配

    int find(char* str) {
    	register int position = root, res = 0;
    	for (int i = 0; str[i]; i++) {
    		position = tree[position][str[i] - 'a'];
            //循环遍历,因为上方的不匹配的字符已经建成了图,所以他实际上在图上跳来跳去
    		for (int j = position; j && ~mark[j]; j = fail[j])
    			res += mark[j], mark[j] = -1;
            //fail指针找到所有匹配的模式串
    	}
    	return res;
    }
    

例题

P3808 【模板】AC自动机(简单版)

P3796 【模板】AC自动机(加强版)


学习资料

强势图解AC自动机

AC自动机 - 关于Fail指针

AC自动机学习笔记

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。
经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。
基层社会治理解决方案摘要 基层社会治理是国家治理体系和治理能力现代化的重要组成部分。本文总结了当前基层社会治理的政策背景、建设背景、现状、整体规划及具体解决方案,旨在提升社会治安综合治理能力,实现社会和谐稳定。 一、政策背景与建设背景 近年来,国家高度重视基层社会治理,出台了一系列政策文件,如《关于加强社会治安防控体系建设的意见》、《社会治安综合治理基础数据规范》等,为基层社会治理提供了政策指导和标准规范。在此背景下,各地纷纷推进综治中心建设,形成市、区、街道、社区四级综治中心体系,实现统一指挥、调度、派遣、监督等功能。市级综治中心作为龙头,负责整体规划和资源调度;区县综治中心作为主体,负责矛盾纠纷化解、群防群治等工作;街道综治中心作为支撑,负责具体事务的受理、办理和监管;社区综治中心则作为基础,负责信息采集、矛盾排查等日常工作。 二、当前现状与问题分析 当前,基层社会治理虽取得一定成效,但仍存在一些问题。一方面,各综治中心建设水平参差不齐,信息孤岛现象严重,无法实现数据共享和业务协同;另一方面,基层社会治理手段相对单一,主要依赖人力巡查和事后处理,缺乏智能化、信息化手段支持。此外,基层社会治理还存在公众参与不足、群防群治机制不健全等问题,影响了社会治理效能的发挥。 三、整体规划与目标设定 针对上述问题,本文提出了基层社会治理的整体规划与目标设定。首先,明确建设思路,即坚持党政领导、整合社会资源、实现互联互通和资源共享;其次,设定建设目标,包括构建综治大脑、实现智能应用、打造基础平台等;最后,制定业务概图,明确各级综治中心的职责和任务,以及物联感知平台、智慧治理等创新应用的建设方向。 四、具体解决方案与实施路径 为实现上述目标,本文提出了具体解决方案与实施路径。一是建设基层治理信息平台,采用微服务模式建设社会信息采集平台、社会综合治理基础平台等核心业务层;二是构建大数据应用中心,整合各类数据资源,实现数据清洗、分类占比、任务调度监控等功能;三是推进信息采集平台建设,实现一键操作、极简极易的信息采集方式;四是完善社会综合治理信息平台功能,包括实有人口、实有房屋、矛盾排查处理等模块;五是建立大联动业务协同系统,实现跨部门、跨领域的业务协同和应急指挥。 五、总结与展望 综上所述,基层社会治理解决方案以提升社会治安综合治理能力为核心,通过政策引导、技术支撑、机制创新等手段,推动基层社会治理向智能化、信息化、协同化方向发展。未来,随着技术的不断进步和政策的持续完善,基层社会治理将更加高效、精准、便捷,为人民群众提供更加安全、和谐、幸福的生活环境。
Python AC自动机是一个用于字符串匹配的算法,它可以高效地在一段文本中查找多个预定义的模式。它的实现可以使用多种库,其中包括ac自动机python和ahocorasick-python。 ac自动机python是一个对标准的ac自动机算法进行了完善和优化的实现,适用于主流的Python发行版,包括Python2和Python3。它提供了更准确的结果,并且可以通过pip进行安装,具体的安装方法可以参考官方文档或者使用pip install命令进行安装。 ahocorasick-python是另一个实现AC自动机的库,它也可以用于Python2和Python3。你可以通过官方网站或者GitHub源码获取更多关于该库的信息和安装指南。 对于AC自动机的使用,一个常见的例子是在一段包含m个字符的文章中查找n个单词出现的次数。要了解AC自动机,需要有关于模式树(字典树)Trie和KMP模式匹配算法的基础知识。AC自动机的算法包括三个步骤:构造一棵Trie树,构造失败指针和模式匹配过程。在构造好AC自动机后,可以使用它来快速地在文本中查找预定义的模式,并统计它们的出现次数。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [ahocorasick-python:AC自动机python的实现,并进行了优化。 主要修复了 查询不准确的问题](https://download.csdn.net/download/weixin_42122986/18825869)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* *3* [Python实现多模匹配——AC自动机](https://blog.csdn.net/zichen_ziqi/article/details/104246446)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值