【做练习】Trie图(AC自动机)模板

实现了一个Trie图(AC自动机)的模板。

Trie图用于多模式串匹配。当模式串数量为1,它退化为KMP自动机。

以下类Trie即为AC自动机模板类。
Trie<int numChar>(char** strs, int nstr, int (*ch2idx)(char))构造一个AC自动机。

  • numChar为AC自动机中所用的字符集合的字符个数。
  • strs为若干个模式串
  • nstr为模式串的数量
  • ch2idx为转换方法,可将一个字符变为它在字符集合里的索引序号。

使用Match(char* str)方法来匹配一个字符串。如果它包含某个模式串,就返回true。否则返回false。

我编写这个模板是用来复习AC自动机的基本原理。大家可以在本代码基础上修改TrieNode结构与Match方法部分内容,使得Match方法可以返回具体匹配了哪个/哪些字符串。

#include <memory.h>
#include <queue>;


template <int numChar>
struct TrieNode
{
	TrieNode* sons[numChar];
	bool dangerous;
	TrieNode* next;

	TrieNode() { memset(this, 0, sizeof(TrieNode)); }
	~TrieNode() { for (int i = 0; i < numChar; i++) if (sons[i] != NULL) delete sons[i]; }
};


template <int numChar>
class Trie
{
private:
	TrieNode<numChar>* root;
	int (*ch2idx)(char);

	// 往Trie树中添加一个字符串。需要提供转换函数ch2idx,将字符转换为它在字符集中的索引。
	void AddStr(char* str, int (*ch2idx)(char))
	{
		TrieNode<numChar>* node = root;
		for (int i = 0; str[i] != '\0'; i++) {
			int idx = ch2idx(str[i]);
			if (node->sons[idx] == NULL) node->sons[idx] = new TrieNode<numChar>();
			node = node->sons[idx];
		}
		node->dangerous = true;
	}

	// 建立好Trie树后,构建Trie图
	void Build()
	{
		std::queue<TrieNode<numChar>*> bfs;
		bfs.push(root);
		while (bfs.empty() == false) {
			TrieNode<numChar>* front = bfs.front();
			for (int i = 0; i < numChar; i++) {
				TrieNode<numChar>* p = front->sons[i];
				if (p == NULL) continue;

				bfs.push(p);
				p->next = root; // 默认的next指针:root
				for (TrieNode<numChar>* q = front->next; q != NULL; q = q->next) {
					if (q->sons[i] != NULL) {
						p->next = q->sons[i];
						if (p->next->dangerous)p->dangerous = 1;
						break;
					}
				}
			}
			bfs.pop();
		}
	}

public:

	//构造Trie图。
	//strs: 若干个模式串。
	//nStr:模式串的书香。
	//ch2idx:转换函数,将字符转换为它在字符集中的索引。
	Trie(char** strs, int nStr, int (*ch2idx)(char)): ch2idx(ch2idx)
	{ 
		root = new TrieNode<numChar>();
		for (int i = 0; i < nStr; i++) AddStr(strs[i], this->ch2idx);
		Build();
	}

	~Trie(){ delete root; }

	// 和字符串str匹配。如果str含有某个模式串,返回true。
	bool Match(char* str)
	{
		TrieNode<numChar>* node = root;

		for (int i = 0; str[i] != '\0';) {
			if (node->dangerous) return true;

			int idx = ch2idx(str[i]);
			if (node->sons[idx] != NULL) {  //该字符成功匹配
				node = node->sons[idx];
				i++;
			}
			else {  // 该字符失配
				if (node != root) node = node->next; // 不在根节点,到next继续匹配
				else i++; // 在根节点,继续下一个字符匹配
			}
		}

		return root->dangerous;  // 它为真当且仅当空串为一个模式串。这是为了正确处理str也是空串的情况。
	}

};

模板应用示例

int main()
{
	int nMod;
	scanf("%d", &nMod);
	char** strs = new char*[nMod];
	for (int i = 0; i < nMod; i++) {
		strs[i] = new char[121];
		scanf("%s", strs[i]);
	}
	

	Trie<26>* triemap = new Trie<26>(strs, nMod, [](char x) {return x - 'a'; });

	for (int i = 0; i < nMod; i++)
		delete[] strs[i];
	delete[] strs;

	int nTest;
	char* buf = new char[1001];
	scanf("%d", &nTest);
	while (nTest--) {
		scanf("%s", buf);
		if (triemap->Match(buf)) printf("YES\n");
		else printf("NO\n");
	}
	

	delete[] buf;
	return 0;
}

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
以下是AC自动机Java模板题U301874的代码实现: ```java import java.io.*; import java.util.*; public class Main { static final int MAXN = 100010, MAXM = 200010; static final int INF = 0x3f3f3f3f; static int n, m, cnt; static int[] trie = new int[MAXN * 30], idx = new int[MAXN * 30]; static int[] fail = new int[MAXN * 30], vis = new int[MAXN * 30]; static int[] head = new int[MAXN], nxt = new int[MAXM], ver = new int[MAXM], tot; static int[] deg = new int[MAXN]; static char[][] str = new char[MAXN][30]; static Map<Character, Integer> map = new HashMap<>(); static int add(char[] s) { int p = 0; for (int i = 0; s[i] != '\0'; i++) { char c = s[i]; if (!map.containsKey(c)) { map.put(c, ++cnt); } int u = map.get(c); if (trie[p] == 0) { trie[p] = ++tot; } p = trie[p]; idx[p] = u; } return p; } static void build() { Queue<Integer> q = new LinkedList<>(); for (int i = 1; i <= cnt; i++) { int u = map.get(str[i][0]); if (trie[0] == 0) { trie[0] = ++tot; } int p = trie[0]; idx[p] = 0; if (trie[p + u] == 0) { trie[p + u] = ++tot; } fail[p + u] = p; q.offer(p + u); } while (!q.isEmpty()) { int u = q.poll(); for (int i = head[idx[u]]; i != 0; i = nxt[i]) { int v = ver[i]; int p = fail[u], q = 0; while (p != 0 && trie[p + v] == 0) { p = fail[p]; } if (trie[p + v] != 0) { q = trie[p + v]; } fail[u + v] = q; q.offer(u + v); } } } static void addEdge(int u, int v) { ver[++tot] = v; nxt[tot] = head[u]; head[u] = tot; } static void topo() { Queue<Integer> q = new LinkedList<>(); for (int i = 1; i <= tot; i++) { if (deg[i] == 0) { q.offer(i); } } while (!q.isEmpty()) { int u = q.poll(); vis[u] = 1; for (int i = head[u]; i != 0; i = nxt[i]) { int v = ver[i]; deg[v]--; if (deg[v] == 0) { q.offer(v); } } } } public static void main(String[] args) { Scanner in = new Scanner(System.in); n = in.nextInt(); for (int i = 1; i <= n; i++) { String s = in.next(); str[i] = s.toCharArray(); add(str[i]); } m = in.nextInt(); for (int i = 1; i <= m; i++) { String s = in.next(); int len = s.length(); int p = 0; for (int j = 0; j < len; j++) { char c = s.charAt(j); if (!map.containsKey(c)) { break; } int u = map.get(c); if (trie[p + u] == 0) { break; } p = trie[p + u]; deg[p]++; addEdge(p, p + u); } } build(); topo(); for (int i = 1; i <= n; i++) { int p = 0; for (int j = 0; str[i][j] != '\0'; j++) { p = trie[p + map.get(str[i][j])]; if (vis[p] == 1) { System.out.println("YES"); break; } } if (vis[p] == 0) { System.out.println("NO"); } } } } ``` 该题解释:给定 $n$ 个模式串和 $m$ 个文本串,问每个模式串是否存在于文本串中。其中,模式串和文本串都只包含小写字母。 AC自动机是一种可以高效匹配多个模式串的数据结构。该题需要使用AC自动机进行多模式串匹配。 代码实现中,使用一个trie树存储所有模式串,每个节点记录了下一层的字符和对应的子节点编号。同时,使用一个map记录每个字符对应的编号,以便于在trie树中查找。 在trie树构建完成后,使用广度优先搜索构建fail指针。搜索过程中,对于每个节点 $u$,依次查找其父亲节点 $p$ 直到根节点,若 $p$ 的子节点 $v$ 与 $u$ 的子节点 $w$ 匹配,则令 $u$ 的fail指针指向 $p+v$ 节点。如果 $p+v$ 节点不存在,则继续向根节点搜索。 在fail指针构建完成后,对于每个文本串,从根节点开始依次匹配每个字符,直到匹配完成或者无法匹配。如果最终匹配的节点已经被访问,则说明该模式串存在于文本串中。 时间复杂度为 $O(\sum |P|+|T|)$,其中 $\sum |P|$ 表示所有模式串的长度之和,$|T|$ 表示所有文本串的长度之和。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值