Trie,又称前缀树或字典树,是一棵有根树,其每个节点包含以下部分:
- 指针数组children,用于指向子节点。对于英文字典树而言,数组长度为26,即小写英文字母的数量。此时,children[0]对应英文字母a,children[1]对应英文字母b,…,children[25]对应小写字母 z。
- 布尔字段 isEnd,表示该节点是否为字符串的结尾。
前缀树是特殊的多叉树,多叉树的定义如下所示:
struct TreeNode {
VALUETYPE value; //结点值
TreeNode* children[NUM]; //指向孩子结点
};
相比较普通的多叉树,前缀树的定义如下所示:
struct TrieNode {
bool isEnd; //该结点是否是一个串的结束
TrieNode* next[26]; //字母映射表
};
插入字符串
描述:向 Trie 中插入一个字符串s
实现:该操作相当于构建链表。首先从根节点的子节点开始,和字符串s中的第一个字符进行匹配,一直匹配到链表上找不到对应的字符为止。这时开始在链表当中插入新的节点,直到插入完 word 的最后一个字符。最后修改最后一个节点的bool值,表示该节点为一个字符串的结束。
void insert(string s) {
Trie* node = this;
for (char c : s) {
if (node->next[c-'a'] == NULL) {
node->next[c-'a'] = new Trie();
}
node = node->next[c-'a'];
}
node->isEnd = true;
}
查找
描述:查找 Trie 中是否存在字符串s
实现:从根节点的子节点开始向下查找,如果出现节点值为空,则返回false。如果遇到最后一个字符,则判断当前节点的bool值是否为结束。
bool search(string word) {
Trie* node = this;
for (char c : word) {
node = node->next[c - 'a'];
if (node == NULL) {
return false;
}
}
return node->isEnd;
}
前缀匹配
描述:判断 Trie 中是否有以字符串s为前缀的单词
实现:和相比,不需要判断最后一个字符结点的是否为结束。无论这个节点是否为结束,后面总有单词以字符串s为前缀。
bool startsWith(string prefix) {
Trie* node = this;
for (char c : prefix) {
node = node->next[c-'a'];
if (node == NULL) {
return false;
}
}
return true;
}