Trie图(AC自动机)阶段做题小结

AC自动机构建完成后,某个节点沿着Fail链向上能从长到短走到自己的所有后缀。一般的,遍历主串进行匹配,就是在Trie图上定向移动的过程。

构造(一遍 BFS)

void build_AC()
{
	int u=0;
	for(int i=0;i<26;i++)
		if(ch[u][i])q[r++]=ch[u][i];
	while(l<r)
	{
		u=q[l++];
		for(int i=0;i<26;i++)
			if(ch[u][i])
			{
				fail[ch[u][i]]=ch[fail[u]][i];
				flag[ch[u][i]]|=flag[fail[ch[u][i]]];
				q[r++]=ch[u][i];
			}
			else
				ch[u][i]=ch[fail[u]][i];
	}
}

1、模式匹配

主串从左到右,就顺着每一个字符向下跳,每一次沿着Fail链向上。这样会可重而不漏的得到模式串中的所有子串,视题目要求进行操作即可。

(1)TJOI2013 单词:本人的LJ做法,把所有串建Trie图,再把所有串拿 # 接起来,然后暴力匹配。

2、利用Fail链进行预处理

(1)不可到达(危险)节点标记:一个串的后缀是危险的,它即是危险的

(2)某些统计:到达某个串结尾处相当于匹配了它和它的所有后缀,可以进行一些sigma之类的操作

3、与Trie图性质相关

(SDOI2005 病毒)模拟一个字符串在Trie图上匹配的过程,危险节点不可走。在此基础上找环。

4、AC自动机相关某些题目

(1)HNOI2004 L语言 :在模式串结尾记LEN,一边模式匹配一边 DP,F[i]|=F[i-len[j]]

(2)USACO2015 删减:在模式串结尾记LEN,维护一个栈,匹配成功时把栈顶上LEN个元素拿走

(3)JSOI2009:密码:在Trie图上进行记忆化搜索(记录所有串的选取状态)输出方案好恶心的

5、Trie图上的DP

一般的,设出如下状态:

F[i][j]:做到主串第i个位置,在Trie图上的j点,……:做到主串第 i 个位置,在Trie图上的 j 点,……。

转移:F[i][j] --> F[i+1][k] (k\epsilon Child[j]) 使用刷表法DP,必要时上矩阵进行优化。

初始状态是 F[0][0]

(1)Fzoj DNA修复:不能往危险节点跑,然后直接F[0][0]=0,F[i+1][k]=min\left \{ F[i][j]+(S[i+1]!=Choose) \right \}

(2)Fzoj 匹配:状压,F[i+1][k][S|Flag[k]]+=F[i][j][S],Flag事先预处理。

(3)Fzoj 中等的字符串:F[i+1][k]=max\left \{ F[i][j] +w[k] \right \}, 构造矩阵转移,类似求 N 条边最长路。

扔一份 暴力DP 的代码:

void dp()
{
	for(int i=0;i<=n;i++)
		for(int j=0;j<=tot;j++)
			f[i][j]=-inf;
	f[0][0]=0;
	for(int i=0;i<n;i++)
		for(int j=0;j<=tot;j++)
			if(f[i][j]>=0)
				for(int x=0;x<26;x++)
				{
					int k=ch[j][x];
					f[i+1][k]=max(f[i+1][k],f[i][j]+num[k]);
				}
}

(4)BJOI2016 打字机:不可做

(5)BJOI2017 魔法咒语:1-6号点暴力做,7-8用转移矩阵,9-10类似 Fib 那样进行转移,挺毒瘤的。

6、Fail树性质(Fail 链自下而上的后缀关系)

一般用于解决与多串相关的子串计数问题。

(1)阿狸的打字机:按题意模拟建 Trie 树,按题意模拟在 Trie 图上跑,走到+1离开-1,用 BIT 维护子树和。

(2)COCI2015 Divljak:先对 Alice 的串建 Trie 图,由 Fail 树性质原问题等价于解决“树链求并”的计数问题,解决方法我是抄题解的:对链的各个底端端点按 dfs 序排序,在各个点处 +1,在相邻两点 LCA 处 -1(想一想为啥)。树剖求 LCA 即可。子树和仍然使用 BIT 维护。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
以下是AC动机Java模板U301874的代码实现: ```java import java.io.*; import java.util.*; public class Main { static final int MAXN = 100010, MAXM = 200010; static final int INF = 0x3f3f3f3f; static int n, m, cnt; static int[] trie = new int[MAXN * 30], idx = new int[MAXN * 30]; static int[] fail = new int[MAXN * 30], vis = new int[MAXN * 30]; static int[] head = new int[MAXN], nxt = new int[MAXM], ver = new int[MAXM], tot; static int[] deg = new int[MAXN]; static char[][] str = new char[MAXN][30]; static Map<Character, Integer> map = new HashMap<>(); static int add(char[] s) { int p = 0; for (int i = 0; s[i] != '\0'; i++) { char c = s[i]; if (!map.containsKey(c)) { map.put(c, ++cnt); } int u = map.get(c); if (trie[p] == 0) { trie[p] = ++tot; } p = trie[p]; idx[p] = u; } return p; } static void build() { Queue<Integer> q = new LinkedList<>(); for (int i = 1; i <= cnt; i++) { int u = map.get(str[i][0]); if (trie[0] == 0) { trie[0] = ++tot; } int p = trie[0]; idx[p] = 0; if (trie[p + u] == 0) { trie[p + u] = ++tot; } fail[p + u] = p; q.offer(p + u); } while (!q.isEmpty()) { int u = q.poll(); for (int i = head[idx[u]]; i != 0; i = nxt[i]) { int v = ver[i]; int p = fail[u], q = 0; while (p != 0 && trie[p + v] == 0) { p = fail[p]; } if (trie[p + v] != 0) { q = trie[p + v]; } fail[u + v] = q; q.offer(u + v); } } } static void addEdge(int u, int v) { ver[++tot] = v; nxt[tot] = head[u]; head[u] = tot; } static void topo() { Queue<Integer> q = new LinkedList<>(); for (int i = 1; i <= tot; i++) { if (deg[i] == 0) { q.offer(i); } } while (!q.isEmpty()) { int u = q.poll(); vis[u] = 1; for (int i = head[u]; i != 0; i = nxt[i]) { int v = ver[i]; deg[v]--; if (deg[v] == 0) { q.offer(v); } } } } public static void main(String[] args) { Scanner in = new Scanner(System.in); n = in.nextInt(); for (int i = 1; i <= n; i++) { String s = in.next(); str[i] = s.toCharArray(); add(str[i]); } m = in.nextInt(); for (int i = 1; i <= m; i++) { String s = in.next(); int len = s.length(); int p = 0; for (int j = 0; j < len; j++) { char c = s.charAt(j); if (!map.containsKey(c)) { break; } int u = map.get(c); if (trie[p + u] == 0) { break; } p = trie[p + u]; deg[p]++; addEdge(p, p + u); } } build(); topo(); for (int i = 1; i <= n; i++) { int p = 0; for (int j = 0; str[i][j] != '\0'; j++) { p = trie[p + map.get(str[i][j])]; if (vis[p] == 1) { System.out.println("YES"); break; } } if (vis[p] == 0) { System.out.println("NO"); } } } } ``` 该解释:给定 $n$ 个模式串和 $m$ 个文本串,问每个模式串是否存在于文本串中。其中,模式串和文本串都只包含小写字母。 AC动机是一种可以高效匹配多个模式串的数据结构。该需要使用AC动机进行多模式串匹配。 代码实现中,使用一个trie树存储所有模式串,每个节点记录了下一层的字符和对应的子节点编号。同时,使用一个map记录每个字符对应的编号,以便于在trie树中查找。 在trie树构建完成后,使用广度优先搜索构建fail指针。搜索过程中,对于每个节点 $u$,依次查找其父亲节点 $p$ 直到根节点,若 $p$ 的子节点 $v$ 与 $u$ 的子节点 $w$ 匹配,则令 $u$ 的fail指针指向 $p+v$ 节点。如果 $p+v$ 节点不存在,则继续向根节点搜索。 在fail指针构建完成后,对于每个文本串,从根节点开始依次匹配每个字符,直到匹配完成或者无法匹配。如果最终匹配的节点已经被访问,则说明该模式串存在于文本串中。 时间复杂度为 $O(\sum |P|+|T|)$,其中 $\sum |P|$ 表示所有模式串的长度之和,$|T|$ 表示所有文本串的长度之和。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值