高效的存储和查找字符串集合
图是一棵Trie树,表示了关键字集合{“a”, “to”, “tea”, “ted”, “ten”, “i”, “in”, “inn”} 。
作用:通常在实现的时候,会在节点结构中设置一个标志,用来标记该结点处是否构成一个单词(关键字)。
Trie树中有个二维数组 son[N][26],表示当前结点的儿子,如果没有的话,可以等于++idx(idx相当于一个分配器,如果需要加入新的结点就用++idx分配出一个下标)。Trie树本质上是一颗多叉树,对于字母而言最多有26个子结点。所以这个数组包含了两条信息。比如:son[1][0]=2表示结点1的一个值为a的子结点为结点2;如果son[1][0] = 0,则意味着没有值为a子结点。这里的son[N][26]相当于链表中的ne[N]。而son[0]代表的就是整棵树的根。
void insert(char str[])
{
int p = 0; //从根结点开始遍历
for (int i = 0; str[i]; i ++ )
{
int u =str[i] - 'a';
if (!son[p][u]) son[p][u] = ++ idx; //没有该子结点就创建一个
p = son[p][u]; //走到p的子结点
}
cnt[p] ++; // cnt相当于链表中的e[idx]
}
insert操作就是一个尾插法,有头节点的链表尾插就要遍历到最后一个元素。这个for循环就是在做这个操作,p可以理解为子树的根,u是这颗子树的孩子节点,idx给孩子节点分配新的空间,cnt作为计数和标记数组。
int query(char *str)
{
int p = 0;
for (int i = 0; str[i]; i ++ )
{
int u = str[i] - 'a';
if (!son[p][u]) return 0;
p = son[p][u];
}
return cnt[p];
}
每次查询就是一次邻接表的遍历过程,如果路径不通就返回0.
维护一个字符串集合,支持两种操作:
I x
向集合中插入一个字符串 x;Q x
询问一个字符串在集合中出现了多少次。
共有 N 个操作,所有输入的字符串总长度不超过 105105,字符串仅包含小写英文字母。
#include<algorithm>
#include<iostream>
using namespace std;
const int N = 100010;
int son[N][26], cnt[N], idx;//下标是0的点既是根节点又是空节点
void insert(char s[])
{
int p = 0;
for (int i = 0; s[i]; i++)
{
int u = s[i] - 'a';
if (!son[p][u]) son[p][u] = ++idx;
p = son[p][u];
}
cnt[p]++;
}
int query(char s[])
{
int p = 0;
for (int i = 0; s[i]; i++)
{
int u = s[i] - 'a';
if (!son[p][u]) return 0;
p = son[p][u];
}
return cnt[p];
}
int main()
{
int n;
cin >> n;
for (int i = 0; i < n; i++)
{
char op;
cin >> op;
char s[N];
cin >> s;
if (op == 'I') insert(s);
else cout << query(s) << endl;
}
return 0;
}
最大异或树
在给定的 N个整数 A1,A2……AN中选出两个进行 xor异或)运算,得到的结果最大是多少?
输入格式
第一行输入一个整数 N。
第二行输入 N 个整数 A1~AN。
输出格式
输出一个整数表示答案。
数据范围
1≤N≤10^5,
0≤Ai<2^31
#include<algorithm>
#include<iostream>
using namespace std;
const int N = 1e7;
int son[N][2], a[N],idx;
void insert(int x)
{
int p = 0;
for (int i = 30; i >= 0; i--)
{
int& s = son[p][x >> i & 1];
if (!s)//该节点不存在
{
s = ++idx;
}
p = s;
}
}
int query(int x)
{
int p = 0;
int res = 0;
for (int i = 30; i >= 0; i--)
{
int s = x>>i&1;
if (son[p][!s])
{
res +=1<<i;//x的i位存在某个数的i位与之异或值为1;
p = son[p][!s];
}
else
{
p = son[p][s];
}
}
return res;
}
int main()
{
int n;
cin >> n;
for (int i = 0; i < n; i++)
{
cin >> a[i];
insert(a[i]);
}
int res = 0;
for (int i = 0; i < n; i++)
{
res = max(res, query(a[i]));
}
cout << res << endl;
return 0;
}