字典树作为一种经典的数据结构,可以很方便的进行单词或者字符串的查询。
其结构大致如下:
我们发现这个形状就是一棵基本的树,字典树其实本质上就是一颗多叉树,可以简单理解成他是一颗26叉的树,每一个节点都最多有26颗子树,对应着26个字母。
我们先来看前缀树如下几个特征:
1、字典树是将一个单词拆分成一个一个字母,然后树上每一个节点则会用来记录字母。
2、每一个单词都对应着树上一个节点到根节点所有字母按序组成,并且单词末会有一个标记。
3、不同的单词会有相同的前缀,它们在树上共享相同字母的节点。
接下来我们来看一下字典树的结构:
class Trie {
private:
bool isEnd;
Trie* trie[26];
public:
Trie() {
isEnd=false;
memset(trie,0,sizeof(trie));
}
注意构造函数中,memset为什么要将一个指针置0呢,因为在C++中对指针赋0就意味着将其视为空指针,如果不进行初始化则会出现**member access within misaligned address 0xbebebebebebebebe for type ‘Trie’**报错,需要特别注意。
从上面的结构我们可以看出一颗树分为了两部分一个代表着当前字母,一个代表单词结尾标记。![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/906bf3986f1a2617736eb3ab4608ab0e.png)
那么字典树是如何进行检索的呢?
如果有单词abd,就最上方的图而言,检索abd就会从根节点沿着树进行搜索,当搜索到d时发现树上存在一个标记表示该字母会是一个单词的结束,那么这个单词就是存在的。
C++具体实现代码:
class Trie {
private:
bool isEnd;
Trie* trie[26];
public:
Trie() {
isEnd=false;
memset(trie,0,sizeof(trie));
}
void insert(string word) {
Trie* node = this;//指向自身对象,本身就是一个Trie,指向自身也是一个Trie类
for(int i=0;i<word.length();i++){
if(node->trie[word[i]-'a']==NULL){
node->trie[word[i]-'a']=new Trie();
}
node = node->trie[word[i]-'a'];
}
node->isEnd = true;
return ;
}
bool search(string word) {
Trie* node = this;
for(int i=0;i<word.length();i++){
if(node->trie[word[i]-'a']==NULL){
return false;
}
else{
node = node->trie[word[i]-'a'];
}
}
if(node->isEnd==true)
return true;
else
return false;
}
bool startsWith(string prefix) {
Trie* node = this;
for(int i=0;i<prefix.length();i++){
if(node->trie[prefix[i]-'a']==NULL){
return false;
}
else{
node = node->trie[prefix[i]-'a'];
}
}
return true;
}
};