回顾/本期梗概
上期我们学习了KMP算法(空降链接),本期我们将学习Trie 字典树。
1、Trie字典树基础知识
(1)什么是字典树
Trie 字典树指的是:某个字符串集合构造的有根树。由于 Trie 字典树,较好的利用了字符串的公共前缀,因此有效的节约存储空间。
Trie 树典型的应用是:用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无畏的字符串比较,查询效率比哈希树高。
它有3个基本性质:
A、根结点不包含字符,除根节点外每一个结点都只包含一个字符;
B、从根结点到某一结点,路径上经过的字符连接起来,为该结点对应的字符串;
C、每个结点的所有子结点包含的字符都不相同。
(2)字典树的时间复杂度、空间复杂度:
时间复杂度:
假设所有字符串长度之和为n,构建字典树的时间复杂度为
假设要查找的字符串长度为k,查找的时间复杂度
空间复杂度:
字典树每个结点都需要用一个数组来存储子结点,即使实际只有两三个结点,但依然需要一个完整大小的数组。所以,字典树比较耗内存,空间复杂度较高。
比如:按上述实现方法,假设有 n 个小写字母的字符串,总长度,则空间复杂度为:。