1、字典树的概念
字典树,因为它的搜索快捷的特性被单词搜索系统使用,故又称单词查找树。它是一种树形结构的数据结构。之所以快速,是因为它用空间代替了速度。
2、字典树的特点:
字典树有三个基本性质:
1、根节点不包含字符,除根节点外每一个节点都只包含一个字符
2、从根节点到某一个节点,路径上经过的字符连接起来,就是该节点对应的字符串
3、每个节点的所有子节点包含的字符都不相同。
3、一个包含以下字符串的字典树结构如下图所示:
add
adbc
bye
4、字典树的应用场景
1) 字符串的快速查找
给出N个单词组成的熟词表,以及一篇全用小写英文书写的文章,请你按最早出现的顺序写出所有不在熟词表中的生词。
在这道题中,我们可以用数组枚举,用哈希,用字典树,先把熟词建一棵树,然后读入文章进行比较,这种方法效率是比较高的。
2) 字典树在“串”排序方面的应用
给定N个互不相同的仅由一个单词构成的英文名,让你将他们按字典序从小到大输出
用字典树进行排序,采用数组的方式创建字典树,这棵树的每个节点的所有儿子
很显然地按照其字母大小排序,对这棵树进行先序遍历即可。
3) 字典树在最长公共前缀问题的应用
对所有串建立字典树,对于两个串的最长公共前缀的长度即他们所在的节点的公共祖先个数,于是,问题就转化为最近公共祖先问题。
5、字典树的数据结构
由以上描述我们可以知道,字典树的数据结构如下:
class TrieNode {
char c;
int occurances;
Map children;
}
对以上属性的描述:
c, 保存的是该节点的数据,只能是一个字符(注意是一个)
occurances, 从单词意思应该知道是发生频率的意思。occurances 是指 当前节点所对应的字符串在字典树里面出现的次数。
children, 就是当前节点的子节点,保存的是它的下一个节点的字符。
7、根据字符串常用的功能,字典树类要实现的特性
1)查询是否包含某个字符串
2)查询某个字符串出现的频率
3)插入某个字符串
4)删除某个字符串
5)获取整个字典树的规模,即字典树中包含的不同字符串的个数
基于以上考虑,可以建立一个接口,Trie类只需要实现这个接口即可
8、基于6所描述的特性创建抽象类如下:
public abstract class AbTrie {
// 判断字典树中是否有该字符串。
public abstract boolean contains(String word);
// 返