概念:字典树(TrieTree),是一种树形结构,典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串,如01字典树)。主要思想是利用字符串的公共前缀来节约存储空间。很好地利用了串的公共前缀,节约了存储空间。字典树主要包含两种操作,插入和查找。
比如,我们要怎么用树存下单词"abc",“abb”,“bca”,"bc"呢?见图
存储串树使用的数组含义:
son[N][26]; //son[N][26]存储的是所有点的26个儿子结点的下标,比如son[1][3]=k存储的就是第一层编号为1的结点的儿子’c’的编号为K
cnt[[N]; //cnt[N]是存储以当前结点编号为结尾的字符串的个数,比如cnt[k]=3表示结点编号为k的字符串的个数是3;
模板题:
Acwing_835. Trie字符串统计
维护一个字符串集合,支持两种操作:
I x 向集合中插入一个字符串 x;
Q x 询问一个字符串在集合中出现了多少次。
共有 N 个操作,输入的字符串总长度不超过 105,字符串仅包含小写英文字母。
输入格式
第一行包含整数 N,表示操作数。
接下来 N 行,每行包含一个操作指令,指令为 I x 或 Q x 中的一种。
输出格式
对于每个询问指令 Q x,都要输出一个整数作为结果,表示 x 在集合中出现的次数。
每个结果占一行。
数据范围
1≤N≤2∗104
输入样例:
5
I abc
Q abc
Q ab
I ab
Q ab
输出样例:
1
0
1
代码如下:
#include<iostream>
using namespace std;
//son[N][26]存储的是所有点的26个儿子结点的下标,比如son[1][3]=k存储的就是第一层编号为1的结点的儿子'c'的编号为K
//cnt[N]是存储以当前结点编号为结尾的字符串的个数,比如cnt[k]=3表示结点编号为k的字符串的个数是3;
const int N=100010;
int son[N][26],cnt[N],idx;
char str[N];
void insert(char str[])
{
int p=0;
for(int i=0;str[i];i++){
int u=str[i]-'a';
if(!son[p][u]) son[p][u]=++idx;
p=son[p][u];
}
cnt[p]++;
}
int query(char str[])
{
int p=0;
for (int i=0;str[i];i++)
{
int u=str[i]-'a';
if(!son[p][u]) return 0;
p=son[p][u];
}
return cnt[p];
}
int main()
{
int n;
char op[2];
cin>>n;
while(n--)
{
scanf("%s%s",op,str);
if(*op=='I') insert(str);
else printf("%d\n",query(str));
}
return 0
}
拓展题:求最大抑或对
Acwing143._最大异或对
在给定的 N 个整数 A1,A2……AN 中选出两个进行 xor(异或)运算,得到的结果最大是多少?
输入格式
第一行输入一个整数 N。
第二行输入 N 个整数 A1~AN。
输出格式
输出一个整数表示答案。
数据范围
1≤N≤105,
0≤Ai<231
输入样例:
3
1 2 3
输出样例:
3
分析:
首先考虑这道暴力做法:二重循环进行枚举,另外为了避免像a1 xor a5枚举一次,a5 xor a1枚举一次从重复情况,第二重循环设置为
for(int i=0;i<n;i++)
{
for(int j=0;j<i;j++){
rse=max(res,a[i]^a[j]);
}
}
暴力枚举的世间复杂度是O(N^2);所以可以对内层循环进行优化:我们知道异或是按照二进制数字进行不进位加法,所以如果要使得a[i] xor k的结果最大,k应该尽可能满足从最高位开始,与a[i]的每一位的数字不相同,这样的话,不同数字异或的结果是1,一定比相同数字异或的结果大,而且又是从最高位开始寻找,所以找到后a[i] xor k的值一定是最大的。另外,如果说实在找不到与a[i]相对位置的不同的数字,那就使用相同数字进行代替;
函数释义:
插入函数,将十进制x表示成二进制数从高位到低位存到trie中
void insert(int x)
{
int p=0;//初始化结点序号
for(int i=30;i>0;i--){//i从最高位开始依次获取该二进制数的每一位(如果二进数不足30位默认在前边补零)
int t=x>>i&1;//获取第i位的二进制数字
if(!son[p][t]) son[p][t]=idx++;
p=son[p][t];
}
}
查询数query(int x)返回与x能形成最大异或对的数字
int insert(int x){
int p=0;
int res=0;//表示返回的结果
for(int i=30;i>=0;i--){
int t=x>>i&1;
if(son[p][!t]) //如果说与x的这一位的二进制数字不同的数字是存在的,就优先选择这个分支。
{
p=son[p][!t];
res=res*2+!t;//对与x能形成最大异或对的数字的二进制表示进行还原
}
else{
p=son[p][t];
res=res*2+t;
}
}
return res;
}
主函数:
int main()
{
int ans=0;
scanf("%d",&n);
//输入
for(int i=0;i<n;i++)
{
scanf("%d",&a[i]);
}
for(int i=0;i<n;i++){
insert(a[i]);//先插入,防止在查询的时候集合为空,
int t=query(a[i]);//查询能形成插入值的xor最大值的伙伴
ans=max(res,t^a[i]);//更行最大值答案
}
cout<<ans<<endl;
return 0;
}