Trie树基本原理（字典树，单词查找树）

最新推荐文章于 2024-03-16 00:20:14 发布

你得支棱起来呀-

最新推荐文章于 2024-03-16 00:20:14 发布

阅读量204

点赞数

分类专栏：数据结构文章标签：数据结构

原文链接：https://blog.csdn.net/forever_dreams/article/details/81009580

版权

数据结构专栏收录该内容

15 篇文章 0 订阅

订阅专栏

https://blog.csdn.net/forever_dreams/article/details/81009580

【介绍】

Trie树是一种树形结构，是一种哈希树的变种。典型应用是用于统计，排序和保存大量的字符串（但不仅限于字符串），所以经常被搜索引擎系统用于文本词频统计。它的优点是：利用字符串的公共前缀来减少查询时间，最大限度地减少无谓的字符串比较，查询效率比哈希树高。

（这是从百度上找来的，本蒟蒻连哈希树是什么都不知道）

【基本思想】

那么首先，Trie树长什么样子呢？

上图就是由单词at，bee，ben，bt，q组成的Trie树

很容易可以看出，每个字母的父亲节点就是它的前一个字母

Trie树的三个性质：

根节点不包含字符，除根节点外每一个节点都只包含一个字符
从根节点到某一节点，路径上经过的字符连接起来，为该节点对应的字符串
每个节点的所有子节点包含的字符都不相同

这样看来，对于一个长为l的单词，无论是插入还是查询都是O（l）的时间复杂度

我习惯于用结构体来存储Trie树：

struct Trie
{
	int son[26];   //son[i]记录的当前节点的子节点 
	int num;       //num是当前这个单词在查询中出现的次数(题目要求) 
}a[1000005];       //其实也不用开到这么大,但我一般为了保险都喜欢开大一点

那么，接下来就是介绍如何插入和查询了

插入：

插入操作就是将单词的每个字母都逐一插入Trie树，插入前看这个字母对应的节点是否存在，若不存在就新建一个节点，否则就共享那一个节点，还是以下图为例：

假如说我们要在原Trie树中新插入一个单词and，那我们的操作为：

插入第一个字母a，发现根节点存在子节点a，则共享节点a
插入第二个字母n，发现节点a不存在子节点n，则新建子节点n
插入第三个字母d，发现节点n不存在子节点d，则新建子节点d

代码如下：


char x[15];        //x是当前的单词 
int t=0;           //t是节点的编号 
void build_trie()
{
	int i,l,p=0;   //p是当前字母的编号 
	l=strlen(x);
	for(i=0;i<l;++i)
	{
		if(a[p].son[x[i]-'a']==0)      //如果这个子节点不存在 
		  a[p].son[x[i]-'a']=++t;      //新建一个子节点 
		p=a[p].son[x[i]-'a'];          //插入下一个字母 
	}
}

查询：

查询操作和插入操作其实差不多，就是在Trie树中找这个单词的每个字母，若找到了就继续找下去，若没有找到就可以直接退出了，因为若没找到就说明没有这个单词，还还还是以下

图为例：

假如说我们要在原Trie树上查询单词and是否存在，那我们的操作为：

查询第一个字母a，发现根节点存在子节点a，则继续查询n
查询第二个字母n，发现节点a不存在子节点n，则直接退出并返回0

代码如下：

char x[15];        //x是当前的单词 
int get_answer()
{
	int i,l,p=0;   //p是当前字母的编号 
	l=strlen(x);
	for(i=0;i<l;++i)
	{
		if(a[p].son[x[i]-'a']==0)      //如果这个子节点不存在 
		  return 0;                    //直接退出并返回0 
		p=a[p].son[x[i]-'a'];          //查询下一个字母 
	}
	a[p].num++;                        //这个单词的查询次数加一(题目要求) 
	return a[p].num;                   //返回它的查询次数 
}