使用trie树统计单词出现的频数

trie树是一种以空间换时间的数据结构,用于降低字符串查询的开销。文章介绍了trie树的原理,如字符种数与branch数量的关系、插入与查询的时间复杂度,并通过一个例子展示了如何利用trie树统计单词出现的频数。作者指出,当前的实现存在遍历效率问题,当处理大量数据时可能导致时间浪费,因此提出了对数据结构优化的需求。
摘要由CSDN通过智能技术生成

首先给出trie树的原理:trie树是以空间换取时间,利用字符串的公共前缀来降低查询开销。举个例子:add,addition,这两个单词,他们的公共前缀是add,应用trie数进行存储的时候,add只会被存储一次,如果以add为前缀的单词很多,这样就节省了很多的存储空间。

trie树的性质:

1,字符种数决定trie中branch的个数,以单词为例,共有26个英文单词,那么每个节点中会有26个指针域。

2,branch数组的下标代表字符相对于a的相对位置。

3,插入和查询的时间复杂度均与给定单词的长度len成正比,即为:o(len)。

4,每个节点附设一个count域,若count域被初始化为0,如果在插入所有单词之后,遍历trie树的时候,count不等于0,则表

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值