1.0 简介
也叫字典树
又称单词查找树 是一种树形结构,是一种哈希树的变种。
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),
所以经常被搜索引擎系统用于文本词频统计。
它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高。
2.0 字典树具有如下性质:
- 根节点不包含字符,除根节点外每一个节点都只包含一个字符。
- 从根节点到某一节点,路径上经过的字符连接起来,为该节点对应的字符串。
- 每个节点的所有子节点包含的字符都不相同。
3.0 节点结构
一般来说MAX是26 因为26个英文字母呗
next是表示每层有多少种类的数,如果只是小写字母,则26即可,若改为大小写字母,则是52,若再加上数字,
则是62了,这里根 据题意来确定。
typedef struct TrieNode //Trie结点声明
{
bool isStr; //标记该结点处是否构成单词
int data;
struct TrieNode *next[MAX]; //儿子分支
}Trie;
4.0 字典树的操作
查找、插入和删除 删除比较少见
4.1 创建
- 考察字符串的第一个字母
- 顺着字典树的相应路径走 例如是a则走第一条路径 c就第三条这样的 可以利用 *p-‘a’ 获取这个字符位于第几个子节点
- 如果没有就创建
每个字典树的用法和定义均是根据自己情况定义 懂这个思想就行了 不用太拘泥于我这个
4.2 查找
查找就是按前缀一个个查,查到了就接着查、。。
每次从根结点开始进行搜索;
- 取要查找关键词的第一个字母,并根据该字母选择对应的子树并转到该子树继续进行检索;
- 在相应的子树上,取得要查找关键词的第二个字母,并进一步选择对应的子树进行检索;
- 迭代上面的过程
- 直到在某个结点处
- 如果最后有个字母查到,则返回这个节点的信息
- 如果最后这个节点没有任何信息 则返回查询失败
4.3 删除
有些题目,数据比较大,需要查询完之后释放内存
删除算法 采用递归算法
void del(node *root){
for(int i = 0; i <MAX; ++i)
if(root->next[i] != NULL)
del(root->next[i]);
delete(root);
}