摘要
博客内容主要介绍了字典树的概念、结构、操作、Java语言实现及应用。
1.字典树的概念
字典树(Trie-Tree)又可以称为单词查找树或键树,是一种树形结构,一种哈希树的变种。可以应用于统计和排序大量的字符串,所以经常被搜索引擎系统用于文本词频统计。其优点为最大限度地减少无谓的字符串比较,查询效率比哈希表还要高。字典树的核心思想为空间换时间。它利用字符串的公共前缀来降低查询时间的开销,以达到提高效率的目的。
2.字典树的结构
字典树的结构如图1所示,其特点可以归纳如下。
图1 字典树结构图
(1)其根结点不包含字符,其他结点只包含一个字符;
(2)节点的每个字节点所包含的字符是不同的;
(3)从根结点到任意节点所经过的路径,连接起来就是该结点对应的字符串;
(4)如果字符的种数为n,则每个结点的出席为n,这也是空间换时间的体现;
(5)插入查找的复杂度为O(n),n为字符串长度。
图1中的字典树由字符串"abc","ab",“bd”,"dda"四个字符串组成。构建过程为:根结点不包含任何字符,遍历第一个字符串"abc",首字母为'a',将其接到根结点的子节点中,再将'b'接到'a'的子结点中,最后将'c'接到'b'的子节点中,并标红注明该结点处可以构成一个单词。遍历第十个字符串"ab",发现'a'->'b'已经存在,则将'b'标红注明该结点可以构成一个单词,如此迭代下去。
3.字典树的操作
字典树的操作主要有插入、删除、查找等。
3.1 插入
字典树的插入过程即字典树的建立过程,其复杂度为O(n*len),n为字符串个数,len为字符串平均长度。
3.2 删除
从字典树中删除某个单词时,可以以递归的形式进行。如从图1中的字典树中删除"ab",它与"abc"同边。
3.3 查找
字典树的查找操作复杂度是O(len),len为字符串的长度。此外,字典树的建立与查找