字典树,又称单词查找树,Trie树,是一种树形结构,典型应用是用于统计,排序和保存大量的字符串,所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来节约存储空间,最大限度的减少无谓的字符串比较,查询效率比哈希表高。
字典树的应用:
- 字符串的快速检索
- 哈希
- 最长公共前缀
#include <iostream>
using namespace std;
#define MAX 26 //字符集大小
typedef struct TrieNode {
int nCount; //记录该字符出现次数
struct TrieNode *next[MAX];
}TrieNode;
TrieNode Memory[1000000];
int allocp =0;
/*初始化*/
void InitTrieRoot(TrieNode **pRoot) {
*pRoot = NULL;
}
/*创建新结点*/
TrieNode *CreateTrieNode() {
int i;
TrieNode *p;
p =&Memory[allocp++];
p->nCount =1;
for(i =0 ; i < MAX ; i++) {
p->next[i] = NULL;
}
return p;
}
//插入
void InsertTrie(TrieNode **pRoot , char*s) {
int i , k;
TrieNode *p;
if(!(p =*pRoot)) {
p =*pRoot = CreateTrieNode();
}
i =0;
while(s[i]) {
k = s[i++] -'a'; //确定branch
if(p->next[k])
p->next[k]->nCount++;
else
p->next[k] = CreateTrieNode();
p = p->next[k];
}
}
//查找
int SearchTrie(TrieNode **pRoot , char*s) {
TrieNode *p;
int i , k;
if(!(p =*pRoot)) {
return 0;
}
i =0;
while(s[i]) {
k = s[i++] -'a';
if(p->next[k] == NULL) return 0;
p = p->next[k];
}
return p->nCount;
}