Trie:一种用来快速插入和查询字符串的多叉树型结构。
树中根节点的值为0,其他节点用来标识路径,以及标记单词插入的次数。边表示字符。
支持两种操作:
- 向集合中插入一个字符串。
- 在集合查询一个字符串。
建立字典树:
- 儿子数组
son[p][j]
存储p这个节点沿着j这条边走到的子节点,边为26个字母对应的映射值(0~25),每个节点都有26个分支节点。如下图中,son[0][2] = 1
意思就是 0号节点沿着字母c(a的映射值为0,b为1,c为2…)这条边走到的节点为1号节点。 - 计数数组
cnt[p]
存储以节点p结尾的单词的插入次数。 - 节点编号
idx
给节点编号。
如:依次插入”cat“,”car“,”busy“,”cate“
插入字符串
void insert(char *s)
{
int p = 0;//指向0号节点
for(int i = 0; s[i]; i++)
{
int j = s[i] - 'a';//将字母映射成数值
if(!son[p][j])//如果当前字符未建立过,先建立子节点,否则p指针直接走到该节点
son[p][j] = ++idx;
p = son[p][j];
}
cnt[p]++;//以p节点结尾的单词插入次数++
}
查询操作
int query(char *s)
{
int p = 0;
for(int i = 0; s[i]; i++)
{
int j = s[i] - 'a';
if(!son[p][j]) return 0;//如果没有找到字母s[i], 即在集合中没有要查询的单词,返回0
p = son[p][j];
}
return cnt[p];//返回以p节点为结尾的单词插入次数
}
模板题
维护一个字符串集合,支持两种操作:
I x
向集合中插入一个字符串 x;
Q x
询问一个字符串在集合中出现了多少次。
共有
N
N
N 个操作,所有输入的字符串总长度不超过
1
0
5
10^5
105,字符串仅包含小写英文字母。
输入格式
第一行包含整数 N N N,表示操作数。
接下来
N
N
N 行,每行包含一个操作指令,指令为 I x
或 Q x
中的一种。
输出格式
对于每个询问指令 Q x
,都要输出一个整数作为结果,表示
x
x
x 在集合中出现的次数。
每个结果占一行。
数据范围
1 ≤ N ≤ 2 ∗ 1 0 4 1≤N≤2∗10^4 1≤N≤2∗104
输入样例:
5
I abc
Q abc
Q ab
I ab
Q ab
输出样例:
1
0
1
#include <iostream>
#include <cstring>
#include <algorithm>
using namespace std;
const int N = 100010;
char s[N];
int son[N][26], cnt[N];//儿子数组和计数数组
int idx;//节点编号
void insert(char *s)
{
int p = 0;
for(int i = 0; s[i]; i++)
{
int j = s[i] - 'a';//字母映射成0~25
if(!son[p][j]) son[p][j] = ++idx;
p = son[p][j];
}
cnt[p]++;
}
int query(char *s)
{
int p = 0;
for(int i = 0; s[i]; i++)
{
int j = s[i] - 'a';
if(!son[p][j]) return 0;
p = son[p][j];
}
return cnt[p];
}
int main()
{
int n;
cin >> n;
while (n -- ){
char op[2];
cin >> op >> s;
if(op[0] == 'I') insert(s);
if(op[0] == 'Q') cout << query(s) << endl;
}
return 0;
}