什么是字典树
Trie树,也叫做字典树,是一种树形结构。往往用于统计和排序大量的字符串前缀来减少查询时间,最大限度的减少字符串比较。
Trie树的核心便是用空间来换取时间,而Trie在算法中也往往采用数组来进行模拟,利用字符串的公共前缀来降低查询时间来达到提高效率的目的。
下面这个图便是字典树。
如何建立字典树
儿子节点 ch[p][j]存储从节点p沿着j这条边走到的子节点,一般会通过映射来转换字符和数字
计树节点 cnt[p]存储以节点p结尾的单词的插入次数
节点编号 inx表示节点编号
建立的字典树的流程便是
- 空Trie 仅有一个根节点,idx为0.
- 从根节点开始查,枚举字符串的每个字符,如果有儿子,p节点就更新为儿子,如果没有儿子,我们就先创建儿子,然后在更新。
- 再记录插入次数
//映射字符
int getsum(char c){
if(c>='A' && c<='Z')
return c-'A';
else if(c>='a' && c<='z')
return c-'a'+26;
else
return c-'0'+52;
}
//插入字符串
void insert(string s){
int p=0
for(int i=0;i<s.size();i++){
int c=getsum(s[i]);
//如果这个数还没有被插入
//那我们就标记节点
if(!t[p][c]) {
t[p][c]=++idx;
}
//将节点数++ 防止多次出现相同的数
p=t[p][c];
cnt[p]++;
}
return;
}
如何查询
查询的流程其实跟插入差不多。
- 从根节点开始查,扫描根节点。
- 如果存在t[p][c],那么我们就更新,不存在我们便直接返回。
- 最后我们在返回插入的次数。
//查询字符串
int find(string s){
int p=0;
for(int i=0;i<s.size();i++){
int c=getsum(s[i]);
//如果这个点没被标记过 那么就说明没有 直接返回
if(!t[p][c])
return 0;
p=t[p][c];
}
//返回插入次数
return cnt[p];
}
推荐例题
【模板】字典树
题目描述
给定 n n n 个模式串 s 1 , s 2 , … , s n s_1, s_2, \dots, s_n s1,s2,…,sn 和 q q q 次询问,每次询问给定一个文本串 t i t_i ti,请回答 s 1 ∼ s n s_1 \sim s_n s1∼sn 中有多少个字符串 s j s_j sj 满足 t i t_i ti 是 s j s_j sj 的前缀。
一个字符串 t t t 是 s s s 的前缀当且仅当从 s s s 的末尾删去若干个(可以为 0 个)连续的字符后与 t t t 相同。
输入的字符串大小敏感。例如,字符串 Fusu
和字符串 fusu
不同。
输入格式
本题单测试点内有多组测试数据。
输入的第一行是一个整数,表示数据组数 T T T。
对于每组数据,格式如下:
第一行是两个整数,分别表示模式串的个数
n
n
n 和询问的个数
q
q
q。
接下来
n
n
n 行,每行一个字符串,表示一个模式串。
接下来
q
q
q 行,每行一个字符串,表示一次询问。
输出格式
按照输入的顺序依次输出各测试数据的答案。
对于每次询问,输出一行一个整数表示答案。
样例 #1
样例输入 #1
3
3 3
fusufusu
fusu
anguei
fusu
anguei
kkksc
5 2
fusu
Fusu
AFakeFusu
afakefusu
fusuisnotfake
Fusu
fusu
1 1
998244353
9
样例输出 #1
2
1
0
1
2
1
提示
数据规模与约定
对于全部的测试点,保证 1 ≤ T , n , q ≤ 1 0 5 1 \leq T, n, q\leq 10^5 1≤T,n,q≤105,且输入字符串的总长度不超过 3 × 1 0 6 3 \times 10^6 3×106。输入的字符串只含大小写字母和数字,且不含空串。
说明
std 的 IO 使用的是关闭同步后的 cin/cout,本题不卡常。
#include<bits/stdc++.h>
using namespace std;
const int N=3e6+7;
//t[p][j]代表创建的字典树,存储从节点p沿着j这条边走到的子节点
//cnt[p]表示以节点p结尾的单词的插入次数
//idx表示节点编号
int T,n,q,t[N][70],cnt[N],idx;
//映射字符
int getsum(char c){
if(c>='A' && c<='Z')
return c-'A';
else if(c>='a' && c<='z')
return c-'a'+26;
else
return c-'0'+52;
}
//插入字符串
void insert(string s){
int p=0;
for(int i=0;i<s.size();i++){
int c=getsum(s[i]);
//如果这个数还没有被插入
//那我们就标记节点
if(!t[p][c]) {
t[p][c]=++idx;
}
//将节点数++ 防止多次出现相同的数
p=t[p][c];
cnt[p]++;
}
return;
}
//查询字符串
int find(string s){
int p=0;
for(int i=0;i<s.size();i++){
int c=getsum(s[i]);
//如果这个点没被标记过 那么就说明没有 直接返回
if(!t[p][c])
return 0;
p=t[p][c];
}
//返回插入次数
return cnt[p];
}
void slove(){
//清空数组
for(int i=0;i<=idx;i++){
for(int j=0;j<=65;j++)
t[i][j]=0;
}
for(int i=0;i<=idx;i++)
cnt[i]=0;
idx=0;
string s;
cin>>n>>q;
for(int i=0;i<n;i++){
cin>>s;
insert(s);
}
for(int i=0;i<q;i++){
cin>>s;
cout<<find(s)<<endl;
}
return;
}
int main() {
cin>>T;
while(T--){
slove();
}
return 0;
}
推荐视频
欢迎大佬指出错误。