AC自动机裸题, 不过我也只是试手, 毕竟才接触这个数据结构。
话说AC自动机是Trie树和KMP算法的结合, 作为一只现在还看不清楚KMP代码的蒟蒻我居然把这个看懂了, 真是机智如我。 以后再也不用担心不会写KMP了, 反正会写AC自动机, 有数据结构就是这么任性!^ω^
题目要求每个字符串出现的次数, 那么我们只要从Trie树的底部向fail指针传递当前字符串的个数进行统计就行了。 考虑到每个字符串的长度太大, 用Rujia Liu的Trie树写法不太合适, 于是参考了别人用指针写的AC自动机, 感觉还是很好的, 不过大体还是用了结构体内置函数的写法。 说到底还是喜欢指针啊。
#include <cstdio>
#include <cstring>
#define N 1000000 + 10
#define M 26
using namespace std;
int n, m;
struct trie;
trie *endo[205];
struct trie
{
trie *p[M], *fail;
int val;
trie() { memset(p, NULL, sizeof p); val = 0; }
int get(char c) { return c - 'a'; }
void insert(char *s, int t)
{
trie *u = this;
int n = strlen(s);
for (int i = 0; i < n; ++i)
{
int c = get(s[i]);
if (u->p[c] == NULL) u->p[c] = new trie();
u = u->p[c];
++u->val;
}
endo[t] = u;
}
};//这里直接把Trie树改写成了节点的形式, 看起来更加简单快捷了
struct Aho_Corasick
{
trie *root;
Aho_Corasick() { root = new trie(); root->fail = NULL; }
void build(int n)
{
static char s[10005];//static是避免局部变量定义过多的前缀(我是这么理解的, 不想写的话就定义全局变量也可)
for (int i = 1; i <= n; ++i)
{
scanf("%s", s);
root->insert(s, i);
}
}
void get_fail()
{
static trie *q[N];
int h = 0, t = 0;
for (int i = 0; i < M; ++i)
if (root->p[i] != NULL)
{
q[++t] = root->p[i];
root->p[i]->fail = root;
}
while(h != t)
{
trie *now = q[++h];
for (int i = 0; i < M; ++i)
if (now->p[i] != NULL)
{
q[++t] = now->p[i];
trie *tmp = now->fail;
while(tmp != root && tmp->p[i] == NULL) tmp = tmp->fail;
if (tmp->p[i] != NULL) tmp = tmp->p[i];
now->p[i]->fail = tmp;
}
}
while(t)
{
q[t]->fail->val += q[t]->val;//累加
t--;
}
}
}solve;
void init()
{
scanf("%d", &n);
solve.build(n);
}
void deal()
{
solve.get_fail();
for (int i = 1; i <= n; ++i)
printf("%d\n", endo[i]->val);
}
int main()
{
init();
deal();
return 0;
}