trie树

最新推荐文章于 2024-06-17 22:22:24 发布

ysu108

最新推荐文章于 2024-06-17 22:22:24 发布

阅读量835

点赞数

分类专栏：经典算法文章标签： table structure 存储 tree 算法 function

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ysu108/article/details/7549833

版权

经典算法专栏收录该内容

33 篇文章 1 订阅

订阅专栏

A trie, or prefix tree, is an ordered tree data structure that is used to store an associative array where the keys are usually strings.

The term trie comes from retrieval.（检索的意思）

它有3个基本性质：

1.根节点不包含字符，除根节点外每一个节点都只包含一个字符。
2.从根节点到某一节点，路径上经过的字符连接起来，为该节点对应的字符串。
3.每个节点的所有子节点包含的字符都不相同。

性能方面：

与别的算法不一样，trie树构造上了利用了词或串“可分”的特性，充分利用了数据的特征，所以trie树在插入，删除和查找上所用时间是很稳定的，所以在对插入，删除，查找都有要求的算法当中，trie树是一种很好的选择。而且当数据量一直增大的时候，不会重建树（hash满时要重建）。当海量数据，且数据较短时trie树的空间消耗很小。

与hash table相比，trie树的优点：

1）trie树支持排序，而hash table得到的结果为一个伪随机的

2）trie树支持最大的前缀匹配

3）Tries tend to be faster on average at insertion than hash tables because hash tables must rebuild their index when it becomes full - a very expensive operation. Tries therefore have much better bounded worst-case time costs, which is important for latency-sensitive programs

4）Since no hash function is used, tries are generally faster than hash tables for small keys.

5）在查寻的时候，trie的的最坏情况上届也远好于hash table，因为hash table在生成的过程中会发生碰撞，链接法散列的最坏情况查找时间为O(n)。

与hash table比缺点：

1）不可用在磁盘存储上，分支多，可能一个结点的不同分支不在一个页面上，而hash 的碰撞后还可能在一个页面上

2）在一些情况下，例如存储浮点数，如果用trie树的话可能会产生很多没有意义的分支就不如hash table存储

应用方面：

1.查找最大匹配前缀

2.字符串分词

3.词频的统计，这时候可以把trie树可以用来存储associative array（功能类似于map和hash_map）

参考：http://en.wikipedia.org/wiki/Trie

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。