Trie树：定义与应用

捕风捉你

于 2024-08-13 23:10:33 发布

阅读量761

点赞数 24

分类专栏：从0开始学算法文章标签： java 服务器算法

本文链接：https://blog.csdn.net/qq_40254606/article/details/141176245

版权

从0开始学算法专栏收录该内容

41 篇文章 2 订阅

订阅专栏

Trie树，也称为字典树或前缀树，是一种专门用于快速检索字符串集合中元素的数据结构。它在许多应用中都有广泛的使用，特别是在自动补全、拼写检查、词典管理和前缀匹配等场景中。本文将详细介绍Trie树的定义、构建、应用以及操作，并提供基于Java的代码实现。

Trie树的定义

Trie树是一种用于存储字符串集合的多叉树结构。每个节点代表字符串中的一个字符，而路径代表从根到某个节点的一条字符串。Trie树通过共享公共前缀的方式有效地组织和存储数据，从而在查找和插入操作中获得较高的效率。

Trie树的主要特点包括：

节点表示字符：每个节点表示一个字符，而路径表示一个字符串。
根节点为空：Trie树的根节点通常为空，用来表示整个树的开始。
子节点指向可能的下一个字符：每个节点的子节点表示可能的下一个字符，从而形成字符串。

Trie树的应用

Trie树主要用于以下应用场景：

字符串前缀匹配：快速查找具有给定前缀的所有字符串。
自动补全：根据输入的前缀，提供可能的补全选项。
拼写检查：通过查找字符串集合，检查单词是否正确。
词典管理：高效存储和管理大量的单词或字符串。

Trie树的构建

构建Trie树通常包括以下步骤：

初始化根节点：创建一个空的根节点，用来表示Trie树的开始。
插入字符串：将字符串逐字符插入到Trie树中，每个字符对应一个节点，且字符之间通过子节点相连。
标记结束字符：在表示字符串最后一个字符的节点处进行标记，以表示该字符串的结束。

Trie树的操作

插入操作

插入操作用于将一个字符串插入到Trie树中。插入的时间复杂度为 (O(m))，其中 (m) 为字符串的长度。

查找操作

查找操作用于判断Trie树中是否包含给定字符串，或查找具有给定前缀的字符串。查找的时间复杂度为 (O(m))。

删除操作

删除操作用于从Trie树中移除指定的字符串，同时保持树的结构完整。删除的时间复杂度为 (O(m))。

Trie树的实现

代码实现

下面是用Java实现Trie树的代码示例：

import java.util.HashMap;
import java.util.Map;

public class Trie {

    // Trie节点的定义
    class TrieNode {
        Map<Character, TrieNode> children;
        boolean isEndOfWord;

        public TrieNode() {
            children = new HashMap<>();
            isEndOfWord = false;
        }
    }

    private final TrieNode root;

    public Trie() {
        root = new TrieNode();
    }

    // 插入一个字符串到Trie树
    public void insert(String word) {
        TrieNode current = root;
        for (char ch : word.toCharArray()) {
            current = current.children.computeIfAbsent(ch, c -> new TrieNode());
        }
        current.isEndOfWord = true;
    }

    // 查找Trie树中是否包含指定字符串
    public boolean search(String word) {
        TrieNode current = root;
        for (char ch : word.toCharArray()) {
            current = current.children.get(ch);
            if (current == null) {
                return false;
            }
        }
        return current.isEndOfWord;
    }

    // 查找Trie树中是否包含指定前缀
    public boolean startsWith(String prefix) {
        TrieNode current = root;
        for (char ch : prefix.toCharArray()) {
            current = current.children.get(ch);
            if (current == null) {
                return false;
            }
        }
        return true;
    }

    // 删除Trie树中的指定字符串
    public void delete(String word) {
        delete(root, word, 0);
    }

    private boolean delete(TrieNode current, String word, int index) {
        if (index == word.length()) {
            if (!current.isEndOfWord) {
                return false;
            }
            current.isEndOfWord = false;
            return current.children.isEmpty();
        }
        char ch = word.charAt(index);
        TrieNode node = current.children.get(ch);
        if (node == null) {
            return false;
        }
        boolean shouldDeleteCurrentNode = delete(node, word, index + 1);

        if (shouldDeleteCurrentNode) {
            current.children.remove(ch);
            return current.children.isEmpty();
        }
        return false;
    }

    public static void main(String[] args) {
        Trie trie = new Trie();

        // 插入单词
        trie.insert("apple");
        trie.insert("app");
        trie.insert("bat");
        trie.insert("ball");

        // 搜索单词
        System.out.println("搜索单词 'apple': " + trie.search("apple"));
        System.out.println("搜索单词 'app': " + trie.search("app"));
        System.out.println("搜索单词 'bat': " + trie.search("bat"));
        System.out.println("搜索单词 'batman': " + trie.search("batman"));

        // 前缀查询
        System.out.println("是否存在前缀 'app': " + trie.startsWith("app"));
        System.out.println("是否存在前缀 'bal': " + trie.startsWith("bal"));
        System.out.println("是否存在前缀 'cat': " + trie.startsWith("cat"));

        // 删除单词
        trie.delete("bat");
        System.out.println("删除单词 'bat' 后搜索 'bat': " + trie.search("bat"));
        System.out.println("删除单词 'bat' 后搜索 'ball': " + trie.search("ball"));
    }
}

代码解释

Trie节点定义：

class TrieNode {
    Map<Character, TrieNode> children;
    boolean isEndOfWord;

    public TrieNode() {
        children = new HashMap<>();
        isEndOfWord = false;
    }
}

每个Trie节点包含一个字符到其子节点的映射 (children) 和一个布尔值 (isEndOfWord)，表示是否是某个单词的结尾。

插入操作：

public void insert(String word) {
    TrieNode current = root;
    for (char ch : word.toCharArray()) {
        current = current.children.computeIfAbsent(ch, c -> new TrieNode());
    }
    current.isEndOfWord = true;
}

逐字符插入字符串，确保在树中构建出相应的路径。

查找操作：

public boolean search(String word) {
    TrieNode current = root;
    for (char ch : word.toCharArray()) {
        current = current.children.get(ch);
        if (current == null) {
            return false;
        }
    }
    return current.isEndOfWord;
}

逐字符查找字符串，并判断是否到达该字符串的结尾。

前缀查找操作：

public boolean startsWith(String prefix) {
    TrieNode current = root;
    for (char ch : prefix.toCharArray()) {
        current = current.children.get(ch);
        if (current == null) {
            return false;
        }
    }
    return true;
}

查找是否存在给定的前缀，若前缀存在，则返回 true。

删除操作：

public void delete(String word) {
    delete(root, word, 0);
}

private boolean delete(TrieNode current, String word, int index) {
    if (index == word.length()) {
        if (!current.isEndOfWord) {
            return false;
        }
        current.isEndOfWord = false;
        return current.children.isEmpty();
    }
    char ch = word.charAt(index);
    TrieNode node = current.children.get(ch);
    if (node == null) {
        return false;
    }
    boolean shouldDeleteCurrentNode = delete(node, word, index + 1);

    if (shouldDeleteCurrentNode) {
        current.children.remove(ch);
        return current.children.isEmpty();
    }
    return false;
}

递归删除Trie树中的某个字符串，并在适当的地方移除节点。

主函数：

public static void main(String[] args) {
    Trie trie = new Trie();

    // 插入单词
    trie.insert("apple");
    trie.insert("app");
    trie.insert("bat");
    trie.insert("ball");

    // 搜索单词
    System.out.println("搜索单词 'apple': " + trie.search("apple"));
    System.out.println("搜索单词 'app': " + trie.search("app"));
    System.out.println("搜索单词 'bat': " + trie.search("bat"));
    System.out.println("搜索单词 'batman': " + trie.search("batman"));

    // 前缀查询
    System.out.println("是否存在前缀 'app': " + trie.startsWith("app"));
    System.out.println("是否存在前缀 'bal': " + trie.startsWith("bal"));
    System.out.println("是否存在前缀 'cat': " + trie.startsWith("cat"));

    // 删除单词
    trie.delete("bat");
    System.out.println("删除单词 'bat' 后搜索 'bat': " + trie.search("bat"));
    System.out.println("删除单词 'bat' 后搜索 'ball': " + trie.search("ball"));
}