Trie 树的本质,就是利用字符串之间的公共前缀,将重复的前缀合并在一起。
其中,根节点不包含任何信息。每个节点表示一个字符串中的字符,从根节点到红色节点的一条路径表示一个字符串(注意:红色节点并不都是叶子节点)。
实现一棵 Trie
Trie 树主要有两个操作:一个是将字符串集合构造成 Trie 树。另一个是在 Trie 树中查询一个字符串。
如何存储一个 Trie 树?
Trie 树是一个多叉树,借助散列表的思想,通过一个下标与字符一一映射的数组,来存储子节点的指针
在 Trie 树中查找字符串的时候,可以通过字符的 ASCII 码减去“a”的 ASCII 码,迅速找到匹配的子节点的指针。比如,d 的 ASCII 码减去 a 的 ASCII 码就是 3,那子节点 d 的指针就存储在数组中下标为 3 的位置中。
查找某个字符串的时间复杂度
构建 Trie 树的过程,需要扫描所有的字符串,时间复杂度是 O(n)(n 表示所有字符串的长度和)。
构建好 Trie 树后,在其中查找字符串的时间复杂度是 O(k),k 表示要查找的字符串的长度。
Trie 树对要处理的字符串有及其严苛的要求
- 字符串中包含的字符集不能太大。
- 要求字符串的前缀重合比较多,不然空间消耗会变大很多。
- 通过指针串起来的数据块是不连续的,而 Trie 树中用到了指针,所以,对缓存并不友好,性能上会打个折扣。