字典树Trie(原理+实现+例题)

什么是字典树

又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。

字典树的原理?


这是一个Trie,它的根是root,树的每一条边标注着一个字符,因为共有26个英文字母,所以这棵树最多有26叉,虽然是26叉树,但是我们可以只利用其中的一部分,以较少操作的复杂度。标红的节点代表一个单词的结束,那么我们深度遍历这棵树就可以得到以下单词{  a(1),abc(123),bac(456),bbc(478),ca(910)  },而节点的编号则是为了方便计数而加上的,因为这棵树用来储存单词,因此被称为字典树。

我们可以通过遍历这棵树来查询某个单词是否出现在字典中,也可以检查一个短单词是不是另一个长单词的前缀(查询长单词的时候经历到短单词的结束点),比如查询3号节点的时候会经过1号节点,说明单词 1==a  是单词 123==abc  的前缀,还有一些其他的用法再后面的例题中会解释到。

插入和查找的复杂度均为O(logN)

字典树的实现:

存储结构:

数组开不好,字典树的题非常容易  Runtime Error !

# maxn是可能出现的单词的个数
# len是单词的最大长度
# cnt是单词的组成字母的数目,一般为26
int trie[maxn*len][cnt]; //用来存储字典树 
int color[maxn*len]; //用来标记单词的终点
int k=1; //字典树节点的标号 

节点的插入:

void insert(char s[]){
	int len=strlen(s);
	int p=0; //位置指针,一开始指向根 
	for(int i=0;i<len;i++){
		int c=s[i]-'a'; //求得下一个字母在第几个节点 
		if(!trie[p][c]){ //节点p的第c个节点,是否存在
			trie[p][c]=k; //不存在的话就新建一个,存在就直接使用
			k++;
		}
		p=trie[p][c]; //指针后移到当前字母所在的节点	
	}
	color[p]=1; //单词结束,标记节点的颜色
}

单词的查询:

bool query(char s[]){
	int len=strlen(s);
	int p=0;
	for(int i=0;i<len;i++){
		int c=s[i]-'a';
		if(!trie[p][c]) //如果这个字母没被记录下来,则说明这个字典中没有这个字符
			return false;
		p=trie[p][c];
	} 
	return color[p]==1; //判断最后一个字母是不是在终点上
}

字典树的例题

HDU-2072 单词数

HDU-1251 统计难题

HDU-1247 Hat’s Words

POJ-3630 Phone List

POJ-2001 Shortest Prefixes

Light OJ-1224 DNA Prefix

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值