0. 前言
Trie
:高效地存储和查找字符串集合的数据结构,也称字典树、前缀树。
数据一定限制了字母的种类,大多都是小写字母、大写字母等等,一般都是 26 个,或者 56 个。
1. Trie
这里的 son[N][26]
相当于链表中的 ne[N]
,存放的是下一个节点的位置,通过 idx++
的操作,保证了不同的 idx
值对应不同的节点。这个和数组模拟单链表、双链表的思路一致,我的之前博文并没有总结,后续做图论、模拟堆等还会大量遇见,需要转变下思维,理解这种数据存储方式。
模板代码:
#include <iostream>
using namespace std;
const int N = 1e5+5;
int m;
char str[N];
int son[N][26], cnt[N], idx; // 根节点和空节点的下标均为0,idx类似于单链表
void insert(char str[]) {
int p = 0;
for (int i = 0; str[i]; ++i) { // c++字符串结尾\0,可以以此判断是否结尾
int u = str[i] - 'a';
if (!son[p][u]) son[p][u] = ++idx; // 不存在则创建,前置++,树头结点为0,存储从1开始,保存下一个节点的位置
p = son[p][u]; // 走到下一个点,若存在直接走下去,若不存在已经在上面创建了
}
cnt[p] ++;
}
int query(char str[]) {
int p = 0;
for (int i = 0; str[i]; ++i) {
int u = str[i] - 'a';
if (!son[p][u]) return 0;
p = son[p][u];
}
return cnt[p];
}
int main() {
cin >> m;
while (m --) {
char op[2];
cin >> op >> str;
if (op[0] == 'I') insert(str);
else cout << query(str) << endl;
}
return 0;
}