概述
Tire树,又称单词查找树,由字符串中的字符所构成,且允许查找、删除和添加单词等操作。
图解
存储形式如图介绍,有时我们可能存储多个重复的单词,那么tire树的存储方式是将单词的重复数标记在该单词的最后一个字符节点上,例如上图的sea就是将sea存储了两次,标记2在最后一个字符a上。
存储方式
Tire树实现的一种方式是建立二维数组,那么不难想到每一层至多可以建立26个节点,由于是二维数组,我们要先将字符形式改为整型int型,存储方式如图所示。
模板题
describe
维护一个字符串集合,支持两种操作:
I x
向集合中插入一个字符串 x;Q x
询问一个字符串在集合中出现了多少次。 共有 N 个操作,所有输入的字符串总长度不超过 105105,字符串仅包含小写英文字母。input
第一行包含整数 N,表示操作数。
接下来 N 行,每行包含一个操作指令,指令为
I x
或Q x
中的一种。1≤N≤2∗104
// Trie树快速存储字符集合和快速查询字符集合
#include <iostream>
using namespace std;
const int N = 100010;
//son[][]存储子节点的位置,分支最多26条;
//cnt[]存储以某节点结尾的字符串个数(同时也起标记作用)
//idx表示当前要插入的节点是第几个,每创建一个节点值+1
int son[N][26], cnt[N], idx;
char str[N];
void insert(char* str)
{
int p = 0; //类似指针,指向当前节点
for (int i = 0; str[i]; i++)
{
int u = str[i] - 'a'; //将字母转化为数字
if (!son[p][u]) son[p][u] = ++idx; //该节点不存在,创建节点
p = son[p][u]; //使“p指针”指向下一个节点
}
cnt[p]++; //结束时的标记,也是记录以此节点结束的字符串个数
}
int query(char* str)
{
int p = 0;
for (int i = 0; str[i]; i++)
{
int u = str[i] - 'a';
if (!son[p][u]) return 0; //该节点不存在,即该字符串不存在
p = son[p][u];
}
return cnt[p]; //返回字符串出现的次数
}
int main()
{
int m;
cin >> m;
while (m--)
{
char op[2];
scanf("%s%s", op, str);
if (*op == 'I') insert(str);
else printf("%d\n", query(str));
}
return 0;
}
模板题
describe
在给定的 N 个整数 1,2……A1,A2……AN 中选出两个进行 xor(异或)运算,得到的结果最大是多少?
#include<iostream>
#include<algorithm>
using namespace std;
int const N = 100010, M = 31 * N;
int n;
int a[N];
int son[M][2], idx;
//M代表一个数字串二进制可以到多长
void insert(int x)
{
int p = 0; //根节点
for (int i = 30; i >= 0; i--)
{
int u = x >> i & 1; /取X的第i位的二进制数是什么 x>>k&1(前面的模板)
if (!son[p][u]) son[p][u] = ++idx; ///如果插入中发现没有该子节点,开出这条路
p = son[p][u]; //指针指向下一层
}
}
int search(int x)
{
int p = 0; int res = 0;
for (int i = 30; i >= 0; i--)
{ ///从最大位开始找
int u = x >> i & 1;
if (son[p][!u]) 如果当前层有对应的不相同的数
{ ///p指针就指到不同数的地址
p = son[p][!u];
res = res * 2 + 1;
///*2相当左移一位 然后如果找到对应位上不同的数res+1
}
else
{
p = son[p][u];
res = res * 2 + 0;
}
}
return res;
}
int main(void)
{
cin.tie(0);
cin >> n;
idx = 0;
for (int i = 0; i < n; i++)
{
cin >> a[i];
insert(a[i]);
}
int res = 0;
for (int i = 0; i < n; i++)
{
res = max(res, search(a[i])); ///search(a[i])查找的是a[i]值的最大与或值
}
cout << res;
}
这道题的启示是:字典树不单单可以高效存储和查找字符串集合,还可以存储二进制数字
思路:将每个数以二进制方式存入字典树,找的时候从最高位去找有无该位的异