[Acwing 835.Tire字符串统计]
维护一个字符串集合,支持两种操作:
I x
向集合中插入一个字符串
x
x
x;
Q x
询问一个字符串在集合中出现了多少次。
共有
N
N
N 个操作,所有输入的字符串总长度不超过
1
0
5
10^5
105,字符串仅包含小写英文字母。
输入格式
第一行包含整数 N N N,表示操作数。
接下来
N
N
N 行,每行包含一个操作指令,指令为 I x
或 Q x
中的一种。
输出格式
对于每个询问指令 Q x
,都要输出一个整数作为结果,表示
x
x
x 在集合中出现的次数。
每个结果占一行。
数据范围
1 ≤ N ≤ 2 ∗ 104 1≤N≤2∗104 1≤N≤2∗104
输入样例:
5
I abc
Q abc
Q ab
I ab
Q ab
输出样例:
1
0
1
思路
Tire树(字典树):字典树是一种树形结构,用于统计和排序大量的字符串,利用字符串的公共前缀来减少查询时间。
这里借用一下网友的图片解释:
代码
#include<iostream>
using namespace std;
const int N = 100010;
int son[N][26],cnt[N],idx;
char str[N];
//son储存子节点的位置
//cnt存储以某个节点结尾的字符串的个数
//idx表示当前的尾节点下标,每新建一个节点下标idx+1
void insert(char *str){
int p=0;//进行遍历的指针
for(int i=0;str[i];i++){
int u=str[i]-'a';//将ASCII码的英文字母转换为数字
if(!son[p][u]) son[p][u]=++idx;//若该节点不存在则建立新节点
p=son[p][u];//使p指向下一个节点位置
}
cnt[p]++;//记录以该节点结尾的字符串的个数
}
int query(char *str){
int p=0;
for(int i=0;str[i];i++){
int u=str[i]-'a';
if(!son[p][u]) return 0;//若该节点不存在,则说明未匹配到该字符串
p=son[p][u];
}
return cnt[p];//返回该字符串出现的次数
}
int main() {
int m;
cin>>m;
while(m--){
char op[2];
scanf("%s%s",op,str);
if(op[0]=='I') insert(str);
else printf("%d\n",query(str));
}
return 0;
}