这是一个非常非常简单的数据结构,正好适合用来作为学完KMP的一个缓冲。
Trie树是一个用来高效地存储和查找字符串集合的数据结构,在算法竞赛中,只会规定很少的结点种类,比如所有的小写英文字母,或者所有大写英文字母等等。
先以存一个abcdef为例,trie树有一个根节点root,接下来我们查询是否有a子结点,如果没有,那就创建一个,以此类推,我们一节一节创建结点,直到把f存完。
如果接下来要存一个bdef,那就会从之前创建的b结点往后存。
在存完所有词之后,我们给所有末端打上标记
当我们查找的时候,我们就看有没有标记就行了。如果发现走到一半没有路径了或者到了位置却没有标记,那就说明我们没有存入这个单词。
具体用法背出一道模板题即可:
代码如下:
#include<iostream>
using namespace std;
const int N = 100010;
int son[N][26];//son子结点,由于题目只要求小写英文字母,那么每一个结点的子结点最多有26个,N表示结点的总数
int cnt[N];//以当前这个点结尾的单词有多少个(重复单词)
int idx;//当前用到的是哪个下标,下标是0 的点,即是根节点,又是空节点
char str[N];
//插入操作
void insert (char str[]) {
int p = 0;
for (int i = 0; str[i]; i ++) {
int u = str[i] - 'a';//把当前这个字母对应的子结点的编号映射为0~25的数
if (!son[p][u]) son[p][u] = ++ idx;
p = son[p][u];
}
cnt[p] ++;
}
//查询操作
int query (char str[]) {
int p = 0;
for (int i = 0; str[i]; i ++) {
int u = str[i] - 'a';
if (!son[p][u]) return 0;
p = son[p][u];
}
return cnt[p];
}
int main () {
int n;
scanf("%d", &n);
while (n --) {
char op[2];
scanf("%s%s", op, str);
if (op[0] == 'I') insert(str);
else printf("%d\n", query(str));
}
return 0;
}