Tiree Tree

什么是tire tree

字典树的结构是多叉树,每个节点有n个出度,每个出度表示一个字符。字典树的节点分为普通节点和终止节点,如图,红色的节点即为终止节点,往字典树中插入一个单词,这个单词的最后一个字符就是终止节点。如图,字典树中包含的单词有:"abcd","abd","b","bcd","efg","hi "。

在输入框自动联想、单词出现频率统计的场景上都应用到了字典树。在有巨量相同前缀的单词中,字典树的效率高于哈希表,时间复杂度固定为O(len(str)),但是字典树的构建会消耗大量空间。字典树的特点就是尽量避免相同前缀的单词重复查找。

图片来自网络

tire tree实现

这里给出两种实现方式,工程上我们会使用class完成目标,但在笔试或者比赛需要更高效的速度,下面java版是工程版,c++版是笔试/比赛版。

在用Java实现字典树时,需要设计节点的数据结构,和上述定义有所区别,这里每个节点表示一个字符,每个每个节点有n个子节点。
字典树的实现:插入、查找、前缀统计。

public class TireTree {

    // 字典树根节点
    private TireNode root = new TireNode();

    // 把一个单词插入字典树
    public void insert(String word) {
        if (word == null || word.length() == 0) return;

        TireNode cur = root;
        char[] chars = word.toCharArray();

        for (char c : chars) {
            TireNode target = cur.son.get(c);

            // 如果子节点中找不到目标字符,则添加目标子节点
            if (target == null) {
                target = new TireNode();
                target.val = c;
                target.end = true;
                cur.son.put(c, target);
            }
            target.num++; // 节点使用数 +1
            cur = target;
        }
        cur.end = true; // 最后的字符节点为终止节点
    }

    // 判断单词是否存在于字典树
    public boolean isExist(String word) {
        if (word == null || word.length() == 0) return false;

        TireNode cur = root;
        char[] chars = word.toCharArray();

        for (char c : chars) {
            TireNode target = cur.son.get(c);
            if (target == null) return false;
            cur = target;
        }
        return cur.end; // 单词最后的字符是终止节点
    }

    // 指定前缀在字典树中出现的次数
    public int count(String word) {
        if (word == null || word.length() == 0) return 0;

        TireNode cur = root;
        char[] chars = word.toCharArray();

        for (char c : chars) {
            TireNode target = cur.son.get(c);
            if (target == null) {
                return 0;
            }
            cur = target;
        }
        return cur.num; // 单词最后的字符被使用次数
    }

    // 字典树节点
    private class TireNode {
        Map<Character, TireNode> son; // 通过字符快速确定是否存在子节点
        char val;
        int num; // 记录有多少个字符串使用了该节点
        boolean end; // 记录节点是否为终结点
        TireNode(){
            son = new HashMap<>();
            val = ' ';
            num = 0;
            end = false;
        }
    }
}

可以参考例题:活动 - AcWing
c++实现中,使用数组存储节点,每个节点的下标表示存储的字母,每个节点存储的数据表示下一个字母所在位置。每个字母通过idx唯一标识,并且使用cnt数组表示一串字符串出现的次数。

#include<iostream>

using namespace std;

const int N = 1e5 + 10; // 所存储的字符串的总长度

int a[N][26], cnt[N], idx;
char str[N];

void insert(char str[]) {
    int p = 0;
    for (int i = 0; str[i]; i ++) {
        int u = str[i] - 'a';
        if (!a[p][u]) a[p][u] = ++idx;
        p = a[p][u];
    }
    cnt[p]++;
}

int query(char str[]) {
    int p = 0;
    for (int i = 0; str[i]; i ++ ) {
        int u = str[i] - 'a';
        if (!a[p][u]) return 0;
        p  = a[p][u];
    }
    return cnt[p];
}

int main() {
    int n;
    cin >> n;
    
    while (n --) {
        char op[2];
        scanf("%s%s", op, str);
        
        if (op[0] == 'I') {
            insert(str);
        } else {
            printf("%d\n", query(str));
        }
    }
    
    return 0;
}

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值