AC自动机必备前置知识之二
本篇博客相对于前两篇还是很认真的(毕竟博主自己画图),前面的ST表和KMP对比较抽象,博主自己讲的话很可能把读者带进坑里,所以链接到其他博客(甩锅加偷懒),Trie树比较具象一些,所以博主就自己讲了。
例题链接(纯模板题):洛谷P2580
Trie树是一个存储字符串的经典算法,该树的根节点无字母,其余子节点均含有一个字母,从根节点往子节点延伸,经过的节点的字母便组成了单词,所以存储和查询的时间复杂度都为O(n),n为单词长度,但是,每个节点的子节点有26个,会消耗大量的空间,也可能造成很多浪费,但针对单词长度比较友好的题目还是有很好的效果。
大概的效果如图(没错,这个博主居然自己画图了!!):
图中的Trie树(省略多余的/被浪费掉的节点)存储了8个单词:AZ , AB , ABC ,ABD , ABE , B , BZZ , BZA(顺序没有什么关系),加了*的节点表示在这里构成了一个单词。
综上所述,这个数据结构的原理还是非常简单的,存储和查询的复杂度也较低,Trie树的结构体定义如下:
struct node{
int son[26];//26个子节点
bool have,cot;//have表示这个节点存不存在单词
//cot表示是否被搜索到过(这是根据例题要求定的)
node()//初始化
{
memset(son,0,sizeof(son));
cot=0;
have=false;
}
};
插入函数如下:
int num=0;
void in(char name[])
{
int a=0,b,len=strlen(name);
for(int i=0;i<len;i++)
{
b=name[i]-'a';
if(!trie[a].son[b])
{//如果该节点还没有出现过,就赋一个序号(相当于指向下一个节点的指针)
trie[a].son[b]=++num;
}
a=trie[a].son[b];//跟着序号指针向下走
}
trie[a].have=1;//走到终点的时候将have赋为true,表示这里有个单词
}
查询函数(基于题目)跟插入的跳转过程差不多,只需要在判断情况的时候多加几个if就好了。
int search(char name[])
{
int a=0,b,len=strlen(name);
for(int i=0;i<len;i++)
{//序号指针的跳转同上
b=name[i]-'a';
if(!trie[a].son[b])
{//如果这里序号为0,直接返回3
return 3;
}
a=trie[a].son[b];
}
if(!trie[a].have)
{//同上
return 3;
}
if(!trie[a].cot)
{//如果这个单词没有被查询过且存在与Trie树中,返回1
trie[a].cot=1;
return 1;
}
//还有种情况就是这个单词被重复查询,返回2
return 2;
}
Trie树的代码和原理都非常友好,这篇博客博主也自认为写的足够详细,希望对大家有所脾益,下一篇AC自动机绝对粗长。。。
例题AC代码:
#include<bits/stdc++.h>
using namespace std;
struct node{
int son[26];
bool have,cot;
node()
{
memset(son,0,sizeof(son));
cot=0;
have=false;
}
};
node trie[800005];
int num(0);
void in(char name[])
{
int a=0,b,len=strlen(name);
for(int i=0;i<len;i++)
{
b=name[i]-'a';
if(!trie[a].son[b])
{
trie[a].son[b]=++num;
}
a=trie[a].son[b];
}
trie[a].have=1;
}
int search(char name[])
{
int a=0,b,len=strlen(name);
for(int i=0;i<len;i++)
{
b=name[i]-'a';
if(!trie[a].son[b])
{
return 3;
}
a=trie[a].son[b];
}
if(!trie[a].have)
{
return 3;
}
if(!trie[a].cot)
{
trie[a].cot=1;
return 1;
}
return 2;
}
int main()
{
char name[55];
int n1;
scanf("%d",&n1);
for(int i=1;i<=n1;i++)
{
scanf("%s",name);
in(name);
}
scanf("%d",&n1);
for(int i=1;i<=n1;i++)
{
scanf("%s",name);
int p=search(name);
if(p==1)
{
printf("OK\n");
continue;
}
if(p==2)
{
printf("REPEAT\n");
continue;
}
printf("WRONG\n");
}
return 0;
}