TrieTree

【定义】

字典树(TrieTree),是一种树形结构,典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串,如01字典树)。

主要思想是利用字符串的公共前缀来节约存储空间。很好地利用了串的公共前缀,节约了存储空间。字典树主要包含两种操作,插入查找

通常在每个字符串结尾的地方标记,这样查找的时候只要找到了字符串中的每个字符且最后一个字符有标记,就说明存在;反之,即使找到了要查找的字符串的每一个字符,但结尾字符的位置没有标记,也属于没有找到。

模板题 Trie字符串统计

【分析】

1.需要用到的

(1) idx:当前用到的点的下标(类似于单链表存储)

(2) cnt [i] :以i结尾的字符串个数

(3) 变量p:p代表查询与插入时的不断变化的当前节点编号,初始化为0,代表初始节点

在函数的循环中,我们首先用x确定接下来要找的字母,再通过变量x确定了接下来我们需要查找当前节点下是否有连接着目标字母的节点。

通过每次确定的x,我们通过son[p][u] 查找连着目标字母的节点的编号,如果目标节点存在,就把p更新成目标节点的编号(p = son[p][u]);

如果son[p][u] == 0,代表字典树中没有这个点,如果是查找就代表没有这个单词,查找失败。

而如果是插入函数,我们就用 ++idx 来把这个点存进字典树。在两个函数的最后,用cnt[p]来标记节点返回节点值

2.下标是0的点既是根节点,又是空节点

#include <bits/stdc++.h>
using namespace std;
const int N=100010;
int son[N][26],cnt[N],idx;//cnt:以某点结尾的字符串个数 
char str[N];
void insert(char str[]){
    int p=0;//从根节点开始
    for(int i=0;str[i];i++){
        int u=str[i]-'a';//将字母a~z转换成数字0~25
        if(!son[p][u]) son[p][u]=++idx;//如果不存在,就另开一个
        p=son[p][u];
    }
    cnt[p]++;
}
int query(char str[]){
    int p=0;
    for(int i=0;str[i];i++){
        int u=str[i]-'a';
        if(!son[p][u]) return 0;//不存在
        p=son[p][u];
    }
    return cnt[p];
}
int main(){
    int n;
    cin>>n;
    while(n--){
        char op[2];
        scanf("%s%s",op,str);
        if(op[0]=='I') insert(str);
        else cout<<query(str)<<endl;
    }
    return 0;
}

例题 最大异或对

【分析】

1.主要思路:将每个数以二进制方式存入字典树,找的时候从最高位去找有无该位的异。

2.insert()

和上面基本是一样的,但因为以二进制存储,我们需要取x的第i位的二进制数是什么( u=x>>i&1),注意遍历时从最高位开始(30~0刚好是31位)。

3.query()

同样从最高位开始取u,然后在当层寻找是否存在与u对应的值

如果u==1,那么如果能够在当层找到某个节点的值为0,前二者就能够进行异或运算;

如果u==0,那么如果能够在当层找到某个节点的值为1,前二者就能够进行异或运算。

这样最后得到的结果res左移一位之后还需加上异或的结果1(res=res*2+1)。

如果不能找到,res直接左移一位即可(res=res*2)。

4.最后,对于每一次寻找取最大值( res=max( res,query (a[i]) ) )

【代码】

#include <bits/stdc++.h>
using namespace std;
const int N=1e5+10,M=31*N;
int son[M][2],a[N];//M代表一个数字串二进制可以到多长
int idx;
void insert(int x){
    int p=0;
    for(int i=30;i>=0;i--){
        int u=x>>i&1;
        if(!son[p][u]) son[p][u]=++idx;
        p=son[p][u];
    }
}
int query(int x){
    int p=0,res=0;
    //从最高位开始找
    for(int i=30;i>=0;i--){
        int u=x>>i&1;
        if(son[p][!u]){
            p=son[p][!u];
            res=res*2+1;
        }//该层存在与某某对应的节点,就令p指向该节点,同时res左移一位并加上该点异或的值1
        else {
            p=son[p][u];
            res=res*2;
        }//否则正常进行
    }
    return res;
}
int main(){
    int n;
    cin>>n;
    for(int i=1;i<=n;i++){
        cin>>a[i];
        insert(a[i]);//插入数据
    }
    int res=0;
    for(int i=1;i<=n;i++){
        res=max(res,query(a[i]));
    }//取最大值
    cout<<res;
    return 0;
}

练习1 模拟散列表

【分析】

其实是上面两种情况的综合

因为数据大小在 -1e9~1e9 之间,所以每次操作我们都令x+=1e9,保证不出现负数而又没有超限,并且数据达到32位,数组大小应为son[ N *32][2]。

然后用二进制存储x,直接查找是否存在即可。

【代码】

#include <bits/stdc++.h>
using namespace std;
const int N=1e5+10;
int son[N*32][2],idx;
int n;
void insert(int x){
    int p=0,u;
    for(int i=31;i>=0;i--){//31~0 三十二位
        u=x>>i&1;
        if(!son[p][u]) son[p][u]=++idx;
        p=son[p][u];
    }
}
int query(int x){
    int p=0,u;
    for(int i=31;i>=0;i--){
        u=x>>i&1;
        if(!son[p][u]) return 0;
        p=son[p][u];
    }
    return 1;//存在
}
int main(){
    cin>>n;
    while(n--){
        int x;
        char op[2];
        cin>>op;
        if(op[0]=='I'){
            cin>>x;
            x+=1e9;
            insert(x);
        }
        else{
            cin>>x;
            x+=1e9;
            if(query(x)) puts("Yes");
            else puts("No");
        }
    }
    return 0;
}

练习2 P2850 错误的点名

虽然但是,我还没搞完。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值