定义
字典树,英文名 trie。顾名思义,就是一个像字典一样的树。
引入
先放一张图:
可以发现,这棵字典树用边来代表字母,而从根结点到树上某一结点的路径就代表了一个字符串。
字典树的数组存储(数组模拟)
我们用边存储字母 trie[x][y]代表指向第x行的存储y所代表字母的一条边
用 idx存储圆圈中的数值其含义为该节点儿子所在行,可以保证存储相同字母的边指向同一列,而且不会有重复利用的点。
这样每个节点值可以帮助我们确认儿子元素是否存在,因为除了第0行每一行至多有一个元素,而每一列没有限制。
为了确认某一字符串是否存在或者重复出现了多少次要在字符串的末尾打上标记可以另加一个数组flag[N]
数据范围
trie[N][M] M为单位元的种类数,N为字符串数量*M.
时间复杂度
存储 o(n)
查找 o(n)
两个n的实际含义不同且n<=N。
代码实现:
Trie字符串统计
维护一个字符串集合,支持两种操作:
I x
向集合中插入一个字符串 x;Q x
询问一个字符串在集合中出现了多少次。
共有 N 个操作,所有输入的字符串总长度不超过 10^5,字符串仅包含小写英文字母。
输入格式
第一行包含整数 N,表示操作数。
接下来 N 行,每行包含一个操作指令,指令为 I x
或 Q x
中的一种。
输出格式
对于每个询问指令 Q x
,都要输出一个整数作为结果,表示 x 在集合中出现的次数。
每个结果占一行。
数据范围
1≤N≤2∗10^4
输入样例:
5
I abc
Q abc
Q ab
I ab
Q ab
输出样例:
1
0
1
#include<iostream>
#include<string>
#include<cstring>
using namespace std;
const int N=1e5+10;
int trie[N][25],cnt[N],idx;
int n;
void insert(string str)
{
int p=0;//根节点的儿子在第0行;
for(int i=0;str[i];i++)
{
int u=str[i]-'a';
if(!trie[p][u])trie[p][u]=++idx;
p=trie[p][u];//节点的儿子在++idx行;
}
cnt[p]++;
}
void query(string str)
{
int p=0;
for(int i=0;str[i];i++)
{
int u=str[i]-'a';
if(!trie[p][u]){cout<<"0"<<endl;return;}
else
p=trie[p][u];//去儿子所在行找str[i+1];
}
cout<<cnt[p]<<endl;
}
int main()
{
cin>>n;
string s,op;
while(n--)
{
cin>>op>>s;
if(op=="I")insert(s);
if(op=="Q")query(s);
}
}
参考: