参考内容:
1. 这位童鞋的文章 http://blog.csdn.net/zhulei632/article/details/6704496
2. 严蔚敏 -数据结构
1.键树的定义:
键树又叫“数字查找树”。深度>=2 . 树中的每个节点一般不是直接包含关键字,而是包含组成关键字的符号(当然叶子节点除外,叶子节点可能包含整个单词以及词频,非叶节点也可包含单词和词频)。根据存储结构的不同,又分为双链树和多重链表树。或者就是常说的“Trie树”,取自检索“retrieve”中间的四个单词。因此也被称为检索树。Trie树的每个节点含有d个指针域(d为关键字的基数,如果是字母,那么基数为26 即a-z .如果是数字,那么基数是10, 即0-9)。
如图所示,一个Trie树的结构如下:
如果在trie树的node节点添加新的域 count,记录已有的单词总数。那么,Trie树除了实现单词查询之外,还可以实现单词频度统计。
如,我们定义的Trie树的节点结构如下:
typedef struct Trie_node{
int count;
struct Trie_node *next[26];
}TrieNode, *Trie;
其中next数组指向下一层次节点。
有了这个结构。Trie树的实现就有了一个基础。
2。Trie树的建立
建立一个Trie树的过程就是不断添加新的单词的过程