//Trie树快速存储字符集合和快速查询字符集合
字典树主要支持两种操作,一种是插入,一种是查询,无论是插入还是查询基本思路都是对该字符串的每个字母进行枚举,判断当前缀为p时,当前这个结点是否存在,如果不存在则进行分配,并将前缀移动到当前结点。
字典树实际上就是通过利用不同字符串前缀相同的特点,来对字符串进行高效存储和查找的一种数据结构。
使用一个二维数据来进行存储,第一维用来区分不同的前缀,第二维表示方向(26个字母总共26个方向)。
例题:
维护一个字符串集合,支持两种操作:
I x
向集合中插入一个字符串 xx;Q x
询问一个字符串在集合中出现了多少次。
共有 NN 个操作,输入的字符串总长度不超过 105105,字符串仅包含小写英文字母。
输入格式
第一行包含整数 NN,表示操作数。
接下来 NN 行,每行包含一个操作指令,指令为 I x
或 Q x
中的一种。
输出格式
对于每个询问指令 Q x
,都要输出一个整数作为结果,表示 xx 在集合中出现的次数。
每个结果占一行。
数据范围
1≤N≤2∗1041≤N≤2∗104
输入样例:
5
I abc
Q abc
Q ab
I ab
Q ab
输出样例:
1
0
1
#include <iostream>
using namespace std;
const int N = 1e5 + 10;
int son[N][26]; // 其中存放的是:子节点对应的idx。其中son数组的第一维是:父节点对应的idx,第第二维计数是:其直接子节点('a' - '0')的值为二维下标。
int cnt [N]; // 以“abc”字符串为例,最后一个字符---‘c’对应的idx作为cnt数组的下标。数组的值是该idx对应的个数。
int idx; // 将该字符串分配的一个树结构中,以下标来记录每一个字符的位置。方便之后的插入和查找。
char str[N];
void insert(char *str)
{
int p = 0;//类似指针,指向当前节点
for (int i = 0; str[i]; i++)
{
int u = str[i] - '0'; //将字母转化为数字
if (!son[p][u]) son[p][u] = ++idx;//该节点不存在,创建节点,其值为下一个节点位置
p = son[p][u];//使“p指针”指向下一个节点位置
}
// 此时的p就是str中最后一个字符对应的trie树的位置idx。
cnt[p]++;//结束时的标记,也是记录以此节点结束的字符串个数
}
int query(char *str)
{
int p = 0;
for (int i = 0; str[i]; i++)
{
int u = str[i] - '0';
if (!son[p][u]) return 0;
p = son[p][u];
}
return cnt[p];//返回字符串出现的次数
}
int main()
{
int n;
scanf("%d", &n);
char op[2];
while (n--)
{
scanf("%s%s", op, str);
if (op[0] == 'I') insert(str);
else printf("%d\n", query(str));
}
return 0;
}