【洛谷】3808 【模板】AC自动机(简单版)

22 篇文章 0 订阅
6 篇文章 0 订阅

题目传送门

终于看懂啦!终于学会了AC自动机啦!(Flag立起)写篇博客梳理一下自己的思路吧。

在文章的开头,必须先放上一些大佬的博客来压压场面:当然是orz ZZK大佬,神犇传送门

然而AC自动机的原理其实是比较好理解的,就是把Trie树和KMP的思想结合起来。这么说起来KMP就是单个字符串的AC自动机啊。(雾)

给出许多模式串,把这些字符串都加入到Trie树中,在每个字符串结尾的叶子节点上计数。

然后在所有模式串都加入Trie树中后开始建立next树,也就是对于所有的模式串做KMP。

首先把和根节点直接相连的节点加入队列中,然后用BFS的思想来确定每个节点的next:取当前的队头,然后枚举这个节点的所有儿子,设当前儿子的字母为ch,当前节点的next为k,取所有存在的儿子,若节点k的ch儿子不为空,则当前节点的儿子的next就等于节点k的ch儿子的编号,否则k=next[k],即保证节点k到根的路径是当前节点到根节点路径的后缀,重复上述操作,直到确定了当前节点的ch儿子。

不过上述求next树的方法过于暴力,可能会TLE,那么我们就会想到上述操作是否有可以优化的地方,答案当然是有的。

依然是去当前的队头,枚举这个节点的所有儿子,若这个儿子存在,那么这个儿子的next就等于节点k的ch儿子,否则这个儿子就等于节点k的ch儿子。

为什么这样的操作可以保证正确性呢?因为我们可以考虑节点k的ch儿子,如果节点k的ch儿子不存在,则把它变成了一个指针,指向它如果存在时匹配的节点。

这样搞了以后就非常方便,不需要每次再向上枚举,浪费时间。

最后就是查询,这题的查询就是求给定的字符串中包含了多少模式串,只要每次向上枚举,答案加上当前节点的计数,然后把当前节点标记为不可取即可。

附上AC代码:

#include <cstdio>
#include <cstring>
#include <queue>
using namespace std;

const int N=1000010;
struct note{
	int nt,ed,lk[26];
}AC[N];
int n,size=0;
char s[N];

inline void insert(char *s){
	int len=strlen(s+1),now=0;
	for (int i=1; i<=len; ++i){
		if (!AC[now].lk[s[i]-'a']) AC[now].lk[s[i]-'a']=++size;
		now=AC[now].lk[s[i]-'a'];
	}
	++AC[now].ed;
	return;
}

inline void build(){
	queue <int> que;
	for (int i=0; i<26; ++i)
		if (AC[0].lk[i]) AC[AC[0].lk[i]].nt=0,que.push(AC[0].lk[i]);
	while (!que.empty()){
		int p=que.front();que.pop();
		for (int i=0; i<26; ++i)
			if (AC[p].lk[i]) AC[AC[p].lk[i]].nt=AC[AC[p].nt].lk[i],que.push(AC[p].lk[i]);
				else AC[p].lk[i]=AC[AC[p].nt].lk[i];
	}
	return;
}

inline int query(char *s){
	int len=strlen(s+1);
	int now=0,ans=0;
	for (int i=1; i<=len; ++i){
		now=AC[now].lk[s[i]-'a'];
		for (int j=now; j&&AC[j].ed!=-1; j=AC[j].nt)
			ans+=AC[j].ed,AC[j].ed=-1;
	}
	return ans;
}

int main(void){
	scanf("%d",&n);
	for (int i=1; i<=n; ++i) scanf("%s",s+1),insert(s);
	AC[0].nt=0;build();
	scanf("%s",s+1),printf("%d",query(s));
	return 0;
}

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
以下是AC自动机Java模板题U301874的代码实现: ```java import java.io.*; import java.util.*; public class Main { static final int MAXN = 100010, MAXM = 200010; static final int INF = 0x3f3f3f3f; static int n, m, cnt; static int[] trie = new int[MAXN * 30], idx = new int[MAXN * 30]; static int[] fail = new int[MAXN * 30], vis = new int[MAXN * 30]; static int[] head = new int[MAXN], nxt = new int[MAXM], ver = new int[MAXM], tot; static int[] deg = new int[MAXN]; static char[][] str = new char[MAXN][30]; static Map<Character, Integer> map = new HashMap<>(); static int add(char[] s) { int p = 0; for (int i = 0; s[i] != '\0'; i++) { char c = s[i]; if (!map.containsKey(c)) { map.put(c, ++cnt); } int u = map.get(c); if (trie[p] == 0) { trie[p] = ++tot; } p = trie[p]; idx[p] = u; } return p; } static void build() { Queue<Integer> q = new LinkedList<>(); for (int i = 1; i <= cnt; i++) { int u = map.get(str[i][0]); if (trie[0] == 0) { trie[0] = ++tot; } int p = trie[0]; idx[p] = 0; if (trie[p + u] == 0) { trie[p + u] = ++tot; } fail[p + u] = p; q.offer(p + u); } while (!q.isEmpty()) { int u = q.poll(); for (int i = head[idx[u]]; i != 0; i = nxt[i]) { int v = ver[i]; int p = fail[u], q = 0; while (p != 0 && trie[p + v] == 0) { p = fail[p]; } if (trie[p + v] != 0) { q = trie[p + v]; } fail[u + v] = q; q.offer(u + v); } } } static void addEdge(int u, int v) { ver[++tot] = v; nxt[tot] = head[u]; head[u] = tot; } static void topo() { Queue<Integer> q = new LinkedList<>(); for (int i = 1; i <= tot; i++) { if (deg[i] == 0) { q.offer(i); } } while (!q.isEmpty()) { int u = q.poll(); vis[u] = 1; for (int i = head[u]; i != 0; i = nxt[i]) { int v = ver[i]; deg[v]--; if (deg[v] == 0) { q.offer(v); } } } } public static void main(String[] args) { Scanner in = new Scanner(System.in); n = in.nextInt(); for (int i = 1; i <= n; i++) { String s = in.next(); str[i] = s.toCharArray(); add(str[i]); } m = in.nextInt(); for (int i = 1; i <= m; i++) { String s = in.next(); int len = s.length(); int p = 0; for (int j = 0; j < len; j++) { char c = s.charAt(j); if (!map.containsKey(c)) { break; } int u = map.get(c); if (trie[p + u] == 0) { break; } p = trie[p + u]; deg[p]++; addEdge(p, p + u); } } build(); topo(); for (int i = 1; i <= n; i++) { int p = 0; for (int j = 0; str[i][j] != '\0'; j++) { p = trie[p + map.get(str[i][j])]; if (vis[p] == 1) { System.out.println("YES"); break; } } if (vis[p] == 0) { System.out.println("NO"); } } } } ``` 该题解释:给定 $n$ 个模式串和 $m$ 个文本串,问每个模式串是否存在于文本串中。其中,模式串和文本串都只包含小写字母。 AC自动机是一种可以高效匹配多个模式串的数据结构。该题需要使用AC自动机进行多模式串匹配。 代码实现中,使用一个trie树存储所有模式串,每个节点记录了下一层的字符和对应的子节点编号。同时,使用一个map记录每个字符对应的编号,以便于在trie树中查找。 在trie树构建完成后,使用广度优先搜索构建fail指针。搜索过程中,对于每个节点 $u$,依次查找其父亲节点 $p$ 直到根节点,若 $p$ 的子节点 $v$ 与 $u$ 的子节点 $w$ 匹配,则令 $u$ 的fail指针指向 $p+v$ 节点。如果 $p+v$ 节点不存在,则继续向根节点搜索。 在fail指针构建完成后,对于每个文本串,从根节点开始依次匹配每个字符,直到匹配完成或者无法匹配。如果最终匹配的节点已经被访问,则说明该模式串存在于文本串中。 时间复杂度为 $O(\sum |P|+|T|)$,其中 $\sum |P|$ 表示所有模式串的长度之和,$|T|$ 表示所有文本串的长度之和。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值