什么是Trie树
Trie树,即字典树,又称单词查找树或键树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。
它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。
Trie的核心思想是空间换时间。利用字符串的公共前缀来降低查询时间的开销以达到提高效率的目的。
它有3个基本性质:
根节点不包含字符,除根节点外每一个节点都只包含一个字符。
从根节点到某一节点,路径上经过的字符连接起来,为该节点对应的字符串。
每个节点的所有子节点包含的字符都不相同。
在本科毕业设计(桌面搜索引擎)中,直接存储了各个字符串。实际上是可以使用字典树来减少空间开销的。
看下图:
字典树就是利用前缀来减少空间开销和增加查找效率的。
------------------------------------------------------------------
字典树的建立也很简单。在向字典树中插入一个新的单词的时候,对于单词的每个字,查看是否在字典树中