浅谈Trie树算法（c++）

一个很不专业的编程小白

已于 2024-08-04 16:49:13 修改

阅读量895

点赞数 9

分类专栏： c++算法文章标签：算法 c++ 图论数论

于 2024-08-03 16:22:43 首次发布

本文链接：https://blog.csdn.net/2301_79587247/article/details/140888167

版权

c++算法专栏收录该内容

23 篇文章 1 订阅

订阅专栏

又称字典树，用边来代表字母，而从根结点到树上某一结点的路径就代表了一个字符
串。举个例子，1->4->8->12 表示的就是字符串 caa。
很简洁、自然的算法，所以也没什么能讲的，下面直接看一道例题及其代码。
在这里插入图片描述

字典树最基础的应用——查找一个字符串是否在“字典”中出现过。

于是他错误的点名开始了

题目背景

XS中学化学竞赛组教练是一个酷爱炉石的人。

他会一边搓炉石一边点名以至于有一天他连续点到了某个同学两次，然后正好被路过的校长发现了然后就是一顿欧拉欧拉欧拉（详情请见已结束比赛 CON900）。

题目描述

这之后校长任命你为特派探员，每天记录他的点名。校长会提供化学竞赛学生的人数和名单，而你需要告诉校长他有没有点错名。（为什么不直接不让他玩炉石。）

输入格式

第一行一个整数 $n$ ，表示班上人数。

接下来 $n$ 行，每行一个字符串表示其名字（互不相同，且只含小写字母，长度不超过 $50$ ）。

第 $n + 2$ 行一个整数 $m$ ，表示教练报的名字个数。

接下来 $m$ 行，每行一个字符串表示教练报的名字（只含小写字母，且长度不超过 $50$ ）。

输出格式

对于每个教练报的名字，输出一行。

如果该名字正确且是第一次出现，输出 OK，如果该名字错误，输出 WRONG，如果该名字正确但不是第一次出现，输出 REPEAT。

样例 #1

样例输入 #1

5  
a
b
c
ad
acd
3
a
a
e

样例输出 #1

OK
REPEAT
WRONG

提示

对于 $40\%$ 的数据， $n\le 1000$ ， $m\le 2000$ 。
对于 $70\%$ 的数据， $n\le 10^4$ ， $m\le 2\times 10^4$ 。
对于 $100\%$ 的数据， $n\le 10^4$ ， $m≤10^5$ 。

$\text{upd 2022.7.30}$ ：新增加一组 Hack 数据。

思路

大概的思想就是对所有名字建 trie，再在 trie 中查询字符串是否存在、是否已经点过名，第一次点名时标记为点过名。
可以从这道题中理解 trie 相对于暴力枚举的优越性：将很多信息放在了一起计算，并且将一些无用的信息直接抛弃掉了。

AC代码

#include<bits/stdc++.h>
using namespace std;
const int N=500010;
char s[60];
int n,m,ch[N][26],tag[N],tot=1;
int main(){
	scanf("%d",&n);
	for(int i=1;i<=n;i++){
		scanf("%s",s+1);
		int u=1;
		for(int j=1;s[j];j++){
			int c=s[j]-'a';
			if(!ch[u][c])ch[u][c]=++tot;
			u=ch[u][c];
		}
		tag[u]=1;
	}
	scanf("%d",&m);
	while(m--){
		scanf("%s",s+1);
		int u=1;
		for(int j=1;s[j];j++){
			int c=s[j]-'a';
			u=ch[u][c];
			if(!u)break;
		}
		if(tag[u]==1){
			tag[u]=2;
			puts("OK");
		}
		else if(tag[u]==2)
			puts("REPEAT");
		else puts("WRONG");
		
	}
}

01Trie

顾名思义，即字符集只有 0/1 的 Trie 树。
常被用来解决有关异或值的问题。
为什么？
异或有着按位考虑的性质，每一位的贡献是分开的，这与 Trie 树用不同的深度存不同的位的性质是吻合的。
如果要最大化异或值，一定是先最大化其最高位，这有一点贪心的思想。所以如果用
Trie 树从高到低来做，正好吻合了这个贪心的思想。

求n个数两两异或的最大值

$1≤N≤10^5 ,0≤A_i<2^{31}$ 将这n个数转成二进制，然后插入到 Trie 树里。
接着再取每个数，在 trie 树上跑一遍，在可能的情况下尽量走与该二进制位不同的方向。
这里用到了贪心的思想，因为二进制下 1xxxxx > 0yyyyy 总是成立的，高位优一定全局优。

AC代码

#include<iostream>
#include<cstdio>
#include<cstring>
using namespace std;
struct node
{
int ch[2];
}a[3000000];
bool num[40];
bool ans[40];
int tot=0;
int f[40];
void insert(int x)
{
memset(num,0,sizeof(num));
for(int i=0;x;i++)
{
num[i]=x&1;
x>>=1;
}
int root=0;
for(int i=30;i>=0;i--)
{
if(!a[root].ch[num[i]])a[root].ch[num[i]]=++tot;
root=a[root].ch[num[i]];
}
}
int find(int x)
{
memset(num,0,sizeof(num));
memset(ans,0,sizeof(ans));
int fh=0;
for(int i=0;x;i++)
{
num[i]=x&1;
x>>=1;
}
int root=0;
for(int i=30;i>=0;i--)
{
if(a[root].ch[num[i]^1])root=a[root].ch[num[i]^1],ans[i]=1;
else root=a[root].ch[num[i]],ans[i]=0;
}
for(int i=0;i<=30;i++)fh+=ans[i]*f[i];
return fh;
}
int main()
{
int n,ans=0,t;
f[0]=1;
for(int i=1;i<=30;i++)f[i]=f[i-1]*2;
scanf("%d%d",&n,&t);
insert(t);
for(int i=2;i<=n;i++)
{
scanf("%d",&t);
ans=max(ans,find(t));
insert(t);
}
cout<<ans;
return 0;
}

Nikitosh 和异或

给定一个含个元素的数组，下标从开始。请找出下面式子的最大值：
$A[l_1]⨁A[l_1+1]…… A[r_1])+(A[l_2]⨁A[l_2+1]…… A[r_2])$
$1 ≤ l_1 ≤ r_1 < l_2 ≤ r_2 ≤ N$
x⨁y，表示和的按位异或。
$2 ≤ N ≤ 4 × 10^5$
$0 ≤ A_i ≤ 10^9$

思路

首先考虑问题的第一部分，对于一个确定的r任取l， $⨁\limits _{i=l}^r a_i$ 的最大值是多少？将这个数组计为vl 。
首先区间异或和也可以表示为两个前缀异或和相异或。
这样的话我们只需要对于确定的r，找到 $s _0, s_1 , s_2 …s_{ r−1}$ 里与 $s_r$ 异或值最大的。
这个问题可以从左到右扫一遍，每次在 trie 里查询 $s_r$ ，接着插入 $s_r$ 就好了。
同样的，我们可以求出对于一个确定的l任取r，最大的异或值是多少。将这个数组计
为vr 。
对vl取前缀max，vr取后缀max ，接着枚举i并统计答案 $vl_i+vr_{i+1}$ 就好了。

AC代码

#include <bits/stdc++.h>
typedef long long LL;
using namespace std;
const int N = 4e5 + 10;
int tree[N * 31][2], cnt;
int l[N], r[N], a[N], n;
inline void add(int x, int rt) {
    for (int i = 31; i >= 0; i--) {
        int y = ((x >> i) & 1);

        if (tree[rt][y] == 0)
            tree[rt][y] = ++cnt;

        rt = tree[rt][y];
    }

    return ;
}
inline int query(int x, int rt) {
    int res = 0;

    for (int i = 31; i >= 0; i--) {
        int y = ((x >> i) & 1);

        if (tree[rt][y ^ 1]) {
            res += (1 << i);
            rt = tree[rt][y ^ 1];
        } else
            rt = tree[rt][y];
    }

    return res;
}
int main() {
    scanf("%d", &n);
    memset(tree, 0, sizeof(tree));
    cnt = 0;

    for (int i = 1; i <= n; i++)
        scanf("%d", &a[i]);

    l[0] = 0;
    int x = 0;

    for (int i = 1; i <= n; i++) {
        x ^= a[i];
        add(x, 0);
        l[i] = max(l[i - 1], query(a[i], 0));
    }

    memset(tree, 0, sizeof(tree));
    r[n + 1] = 0;
    x = 0;

    for (int i = n; i >= 1; i--) {
        x ^= a[i];
        add(x, 0);
        r[i] = max(r[i + 1], query(a[i], 0));
    }

    int ans = 0;

    for (int i = 1; i <= n; i++)
        ans = max(ans, l[i] + r[i + 1]);

    printf("%d\n", ans);
    return 0;
}

The XOR-longest Path

给定一棵 n 个点的带权树，求树上最长的异或和路径。
$1 ≤ n ≤ 10^5$
, $1 ≤ u, v ≤ n, 0 ≤ w < 2^{31}$

思路

异或的一个很重要的性质：
x ⊕ x = 0。
所以说，如果一个元素，我们对其进行了重复的异或，但是这个重复次数是偶数次，那
么可以视作没有进行异或。
那么，对于树上的一条路径，我们就有了一个极为优美的表示方式：
$p a t h (x, y) = p a t h (x, l c a) \oplus p a t h (l c a, y) = p a t h (x, roo t) \oplus p a t h (y, roo t)$
只要求出每个点到根节点的异或和（通过 dfs 就可以简单实现），问题就转化为第一道
题，求点对的最大异或值。

AC代码

#include <bits/stdc++.h>
using namespace std;
inline int read() {
    char ch = getchar();
    int x = 0;

    while (!isdigit(ch))
        ch = getchar();

    while (isdigit(ch)) {
        x = x * 10 + ch - '0';
        ch = getchar();
    }

    return x;
}
const int N = 1e5 + 3;
struct emm {
    int e, f, v;
} a[2 * N];
int h[N];
int idx = 0;
inline  void con(int x, int y, int l) {
    a[++idx].f = h[x];
    h[x] = idx;
    a[idx].e = y;
    a[idx].v = l;
    a[++idx].f = h[y];
    h[y] = idx;
    a[idx].e = x;
    a[idx].v = l;
    return;
}
int d[N], w[N];
void dfs(int x) {
    for (int i = h[x]; i; i = a[i].f)
        if (!d[a[i].e]) {
            w[a[i].e] = (w[x] ^ a[i].v);
            d[a[i].e] = d[x] + 1;
            dfs(a[i].e);
        }

    return;
}
struct ahh {
    int nxt[2];
} tr[3200003];
int cnt = 0;
int b[33];
inline int get(int x) {
    int j = -1;

    while (x) {
        b[++j] = x & 1;
        x >>= 1;
    }

    return j;
}
inline  void add(int x) {
    memset(b, 0, sizeof(b));
    int j = get(x);
    int k = 0;

    for (int j = 31; j >= 0; --j) {
        if (!tr[k].nxt[b[j]])
            tr[k].nxt[b[j]] = ++cnt;

        k = tr[k].nxt[b[j]];
    }

    return;
}
inline long long find(int x) {
    memset(b, 0, sizeof(b));
    int j = get(x);
    long long now = 0;
    int k = 0;

    for (int j = 31; j >= 0; --j) {
        if (tr[k].nxt[1 - b[j]]) {
            now += (1 << j);
            k = tr[k].nxt[1 - b[j]];
        } else
            k = tr[k].nxt[b[j]];
    }

    return now;
}
int main() {
    int n = read();

    for (int i = 1; i < n; ++i) {
        int u = read(), v = read(), w = read();
        con(u, v, w);
    }

    int s = min(7, n);
    d[s] = 1;
    dfs(s);
    long long ans = 0;

    for (int i = 1; i <= n; ++i)
        add(w[i]);

    for (int i = 1; i <= n; ++i)
        ans = max(ans, find(w[i]));

    cout << ans;
    return 0;
}

这是我的第二十篇文章，如有纰漏也请各位大佬指正
辛苦创作不易，还望看官点赞收藏打赏，后续还会更新新的内容。

一个很不专业的编程小白

关注

9
点赞
踩
24

收藏

觉得还不错? 一键收藏
0
评论
浅谈Trie树算法（c++）

又称字典树，用边来代表字母，而从根结点到树上某一结点的路径就代表了一个字符串。举个例子，1->4->8->12 表示的就是字符串 caa。很简洁、自然的算法，所以也没什么能讲的，下面直接看一道例题及其代码。字典树最基础的应用——查找一个字符串是否在“字典”中出现过。
复制链接

扫一扫