Tire 字典树、前缀树

最新推荐文章于 2024-08-12 15:45:48 发布

下水道程序员

最新推荐文章于 2024-08-12 15:45:48 发布

阅读量394

点赞数 8

文章标签： java 数据结构

本文链接：https://blog.csdn.net/Cobrander2_0/article/details/138334028

版权

本文介绍了字典树作为一种高效的数据结构，用于字符串操作，如查找、插入、删除和统计。重点讲解了其工作原理、基本性质，并给出了一个用Java实现的Trie类实例。

摘要由CSDN通过智能技术生成

字典树（又称单词查找树或Trie树）是一种树形结构，它是哈希树的变种，通常用于统计、排序和保存大量的字符串（但不仅限于字符串）。字典树在搜索引擎系统中常用于文本词频统计。它的主要优点在于能够利用字符串的公共前缀来减少查询时间，从而最大限度地减少无谓的字符串比较，因此查询效率通常比哈希树高。

字典树有三个基本性质：

根节点不包含字符，除根节点外每一个节点都只包含一个字符。
从根节点到某一节点，路径上经过的字符连接起来，为该节点对应的字符串。
每个节点的所有子节点包含的字符都不相同。

字典树的基本操作包括查找、插入和删除，但删除操作相对较少见。在查找操作中，通常从根节点开始，依次搜索关键词的每个字母，直到找到对应的节点或确定关键词不存在于树中。

字典树的应用场景非常广泛，包括但不限于：

字符串检索：将已知的一些字符串（如字典）的有关信息保存到字典树中，然后查找其他未知字符串是否出现过或出现的频率。
文本过滤：给定一个词典，其中的单词为不良单词，然后判断一段文本中是否含有任何不良单词。
字符串去重和排序：处理大量字符串时，可以使用字典树来去除重复字符串，并按字典序进行排序。
热门查询统计：搜索引擎可以通过日志文件记录用户每次检索使用的检索串，并使用字典树来统计热门查询。
字符串最长公共前缀：利用字典树可以快速得到某些字符串的公共前缀。

下面是使用java程序来实现该数据结构（仅限于26个英文字母）

class Trie {
    private Trie[] children;
    private boolean isEnd;

    public Trie() {
        children = new Trie[26];
        isEnd = false;
    }
    
    public void insert(String word) {
        Trie node = this;
        for (int i = 0; i < word.length(); i++) {
            char ch = word.charAt(i);
            int index = ch - 'a';
            if (node.children[index] == null) {
                node.children[index] = new Trie();
            }
            node = node.children[index];
        }
        node.isEnd = true;
    }
    
    public boolean search(String word) {
        Trie node = searchPrefix(word);
        return node != null && node.isEnd;
    }
    
    public boolean startsWith(String prefix) {
        return searchPrefix(prefix) != null;
    }

    private Trie searchPrefix(String prefix) {
        Trie node = this;
        for (int i = 0; i < prefix.length(); i++) {
            char ch = prefix.charAt(i);
            int index = ch - 'a';
            if (node.children[index] == null) {
                return null;
            }
            node = node.children[index];
        }
        return node;
    }
}

下水道程序员

关注

8
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
Tire 字典树、前缀树

字典树（又称单词查找树或Trie树）是一种树形结构，它是哈希树的变种，通常用于统计、排序和保存大量的字符串（但不仅限于字符串）。字典树在搜索引擎系统中常用于文本词频统计。它的主要优点在于能够利用字符串的公共前缀来减少查询时间，从而最大限度地减少无谓的字符串比较，因此查询效率通常比哈希树高。字典树的基本操作包括查找、插入和删除，但删除操作相对较少见。在查找操作中，通常从根节点开始，依次搜索关键词的每个字母，直到找到对应的节点或确定关键词不存在于树中。
复制链接

扫一扫