前缀树 Implement Trie (Prefix Tree)

作者:LeetCode
链接:https://leetcode-cn.com/problems/implement-trie-prefix-tree/solution/shi-xian-trie-qian-zhui-shu-by-leetcode/
来源:力扣(LeetCode)
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

 

编者注:本文核心内容大部分来自leetcode,我只是以自己思维方式做了整理,希望对大家有所帮助。如有错误,辛苦指出,谢谢!

什么是前缀树(What)

一种树数据结构,用于检索字符串数据集中的键,以及根据前缀获得该前缀下对应的所有串。

为什么使用前缀树(Why)

  • 找到具有同一前缀的全部键值
  • 按词典序枚举字符串的数据集
  • Trie 树优于哈希表的另一个理由是,随着哈希表大小增加,会出现大量的冲突,时间复杂度可能增加到 O(n),其中 n 是插入的键的数量。与哈希表相比,Trie 树在存储多个具有相同前缀的键时可以使用较少的空间(前缀复用)。此时 Trie 树只需要 O(m)的时间复杂度,其中 m 为键长。而在平衡树中查找键值需要 O(mlogn) 时间复杂度。(原因见下图)

  • 平衡树查找时间复杂度分析:

  • 前缀树查找时间复杂度分析:

什么时候(业务场景举例)应该使用前缀树(When)

1. 自动补全(应用于搜索框中  中文字典树应用于中文词自动补全中,搜索词确定后的搜索是使用全文检索实现?)

无效的图片地址
图 1. 谷歌的搜索建议

2. 拼写检查(常用于文档编辑中 判断用户写下的词是否在字典树中)

image.png
图2. 文字处理软件中的拼写检查

3. IP 路由 (最长前缀匹配)

无效的图片地址
图 3. 使用Trie树的最长前缀匹配算法,Internet 协议(IP)路由中利用转发表选择路径。

4. T9 (九宫格) 打字预测(找出指定前缀下的所有单词 一定排序规则后展示前x个 预测用户输入)

无效的图片地址
图 4. T9(九宫格输入),在 20 世纪 90 年代常用于手机输入

5. 单词游戏(用于判断前缀 是否合法)

image.png
图 5. Trie 树可通过剪枝搜索空间来高效解决 Boggle 单词游戏

如何实现前缀树(How)

1 向前缀树中增加键

从根开始搜索它对应于第一个键字符的链接。有两种情况:

1.1 链接存在。沿着链接移动到树的下一个子层。算法继续搜索下一个键字符。
1.2 链接不存在。创建一个新的节点,并将它与父节点的链接相连,该链接与当前的键字符相匹配。

重复以上步骤,直到到达键的最后一个字符,然后将当前节点标记为结束节点,算法完成。

 

    // Inserts a word into the trie.
    public void insert(String word) {
        TrieNode node = root;
        for (int i = 0; i < word.length(); i++) {
            char currentChar = word.charAt(i);
            // 如不存在 创建并将char node put到父节点的map缓存中
            // 从父节点中查子节点信息 使用map缓存提高效率
            if (!node.containsKey(currentChar)) {
                node.put(currentChar, new TrieNode());
            }
            node = node.get(currentChar);
        }
        node.setEnd();
    }

复杂度分析

时间复杂度:O(m),其中 m 为键长。在算法的每次迭代中,我们要么检查要么创建一个节点,直到到达键尾。只需要 m 次操作。

空间复杂度:O(m)。最坏的情况下,新插入的键和 Trie 树中已有的键没有公共前缀。此时需要添加 m 个结点,使用 O(m) 空间。

2 从前缀树中查找键

第一个键字符从根开始,。检查当前节点中与键字符对应的链接。有两种情况:

2.1 存在链接。我们移动到该链接后面路径中的下一个节点,并继续搜索下一个键字符。
2.2 不存在链接。若已无键字符,且当前结点标记为 isEnd,则返回 true。否则有两种可能,均返回 false :
还有键字符剩余,但无法跟随 Trie 树的键路径,找不到键。
没有键字符剩余,但当前结点没有标记为 isEnd。也就是说,待查找键只是Trie树中另一个键的前缀。

image.png

如图所示 一个节点有两个属性:

1 子链接

2 当前节点是否是end节点

    // search a prefix or whole key in trie and
    // returns the node where search ends
    // 前缀搜索方法
    private TrieNode searchPrefix(String word) {
        TrieNode node = root;
        for (int i = 0; i < word.length(); i++) {
           char curLetter = word.charAt(i);
           if (node.containsKey(curLetter)) {
               node = node.get(curLetter);
           } else {
               return null;
           }
        }
        return node;
    }

    // Returns if the word is in the trie.
    // 全量搜索方法
    public boolean search(String word) {
       TrieNode node = searchPrefix(word);
       return node != null && node.isEnd();
    }

搜索方法提供了

1 前缀搜索方法

2 全量搜索方法

复杂度分析

  • 时间复杂度 : O(m)。算法的每一步均搜索下一个键字符。最坏的情况下需要 m 次操作。
  • 空间复杂度 : O(1)。

练习题目
下面是一些很好的问题,供您练习使用 Trie 数据结构。

https://leetcode-cn.com/problems/add-and-search-word-data-structure-design/ 添加与搜索单词 - 一个 Trie 树的直接应用。
https://leetcode-cn.com/problems/word-search-ii/ 单词搜索 II - 类似 Boggle 的游戏。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值