AC 自动机

  • AC 自动机

例题

【模板】AC 自动机(简单版)

原理

AC 自动机主要用于解决多模式匹配的问题。即给定 n 个模式串与一个主串,查找有多少个模式串在主串中出现过

定义

字典树:定义详见字典树

树边:字典树上的边。

回跳边:指向父节点的回跳边所指节点的子节点,且该子节点上的字符与当前节点上的字符相同;如果满足条件的子节点不存在,则回跳边指向根节点。

转移边(关于字符 i i i):指向当前节点的回跳边所指节点的存储字符 i i i 的子节点(父子关系可以通过树边或者转移边建立)。

P . S . P.S. P.S. 转移边存在的意义是:当某个节点不存在到存储字符 i i i 的节点的树边的时候,我们人为地构建一条边(即转移边)(当然也有限制条件),使得该节点可以通过这条边跳转到树上某个存储字符 i i i 的节点上(如果树上没有节点存储字符 i i i,那么就跳转到根节点)。转移边的构建方式能够保证经过转移边到达指向的节点是从根节点途径当前节点,能够达到目标字符 i i i 的最短路。换言之,转移边是树边的补充,目的是能够借助树上存在的节点补充某个节点没有的子节点,同时让抵达这个节点的路径最短

构造 AC 自动机

我们使用 ne[v] 存储节点 v v v 的回跳边的终点,使用 ch[u][i] 存储节点 u u u可以指向字符 i i i 的树边 的终点,使用 ch[u][i] 存储节点 u u u可以指向字符 i i i 的转移边 的终点(也就是说,从 u u uch[u][i] 有一条树边,且节点 ch[u][i] 上的字符为 i i i;从 u u uch[u][i] 有一条转移边,且节点 ch[u][i] 上的字符为 i i i)。

由定义,回跳边指向的节点一定是当前节点的最长真后缀;继承当前路径,通过转移边到达转移边指向的节点的路径一定是从根节点到达当前节点表示字符的最短路

我们采用 BFS 来构造 AC 自动机。初始化的时候,我们让根节点的子节点全部入队,当搜索队列非空时,令队首节点 u u u 出队。枚举 u u u 26 26 26 个可能的子节点:如果子节点存在,则通过 u u u 建立子节点的回跳边;如果子节点不存在,则 u u u 自己建立回跳边

需要注意的是,根节点的回跳边仍然指向根节点。

查找过程

我们依次取出主串中的字符 s[k]用指针 i i i 指向主串对应的节点,沿着树边或者转移边移动。对于指针 i i i 的每一次移动,用指针 j j j 从指针 i i i 当前所在的位置开始,沿着回跳边搜索模式串,每次从当前节点走到根节点,保证能够把当前节点中的所有后缀模式串搜索到。当主串被扫描完毕后,返回答案。

代码

#include <iostream>
#include <queue>
using namespace std;
const int N = 1000005;
int ch[N][30];//存储字典树上的树边(以及转移边)指向的节点
int ne[N];//存储字典树上每个节点的回跳边指向的节点
int idx = 0;//用于给字典树上的节点编号
char s[N], t[N];//模式串与文本串
int cnt[N];//表示某个节点记录的的字符串在输入的模式串中出现的次数

int getnum(char c)
{
	return c - 'a';
}

void insert(char str[])
{//插入操作,建立字典树
	int p = 0;
	for (int i = 0; str[i]; i++)
	{
		int j = getnum(str[i]);
		if (!ch[p][j])ch[p][j] = ++idx;
		p = ch[p][j];
	}
	cnt[p]++;
}

void build()
{//建立AC自动机
	queue<int>q;
	for (int i = 0; i < 26; i++)
		if (ch[0][i])q.push(ch[0][i]);
	//深度为1的节点(与根节点直接相连)的回跳边指向根节点
	while (!q.empty())
	{
		int u = q.front();
		for (int i = 0; i < 26; i++)
		{
			int v = ch[u][i];
			if (v)//如果节点u存在存储字符i的子节点v
			{//为v建立回跳边
				ne[v] = ch[ne[u]][i];//v的回跳边 指向 v的父节点u的回跳边指向的存储字符i的子节点ch[ne[u]][i]
				q.push(v);
			}
			else ch[u][i] = ch[ne[u]][i];//如果没有满足的子节点,就建立转移边到达目标节点
		}
		q.pop();
	}
}

int query(char str[])
{
	int ans = 0;
	for (int k = 0, i = 0; str[k]; k++)//遍历主串中的每一个字符
	{
		i = ch[i][getnum(str[k])];//i指向主串,沿着树边或者转移边移动
		for (int j = i; j && (cnt[j] != -1); j = ne[j])//j指向模式串,沿着回跳边移动,直到j指向根节点或者j指向的节点已经被计算过
		{
			ans += cnt[j];
			cnt[j] = -1;
		}
	}
	return ans;
}

int main()
{
	int n;//模式串的个数
	cin >> n;
	for (int i = 1; i <= n; i++)
	{
		cin >> s;//输入模式串
		insert(s);//建树
	}
	build();
	cin >> t;//输入文本串
	cout << query(t) << endl;//查找
	return 0;
}
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值