前缀树
字典树(前缀树,Tire)是一种树形数据结构,用于高效地存储和检索字符串数据集中的键。前缀树可以用 O(|S|)的时间复杂度完成如下操作,其中 |S| 是插入字符串或查询前缀的长度:
- 向字典树中插入字符串 word;
- 查询字符串 word 是否已经插入到字典树中。
- 指向子节点的指针数组 children。数组长度为 26,即小写英文字母的数量。此时 children[0] 对应小写字母 a,children[1] 对应小写字母 b,…,children[25] 对应小写字母 z。
- 布尔字段 isEnd,表示该节点是否为字符串的结尾。
插入字符串
我们从字典树的根开始,插入字符串。对于当前字符对应的子节点,有两种情况:
- 子节点存在。沿着指针移动到子节点,继续处理下一个字符。
- 子节点不存在。创建一个新的子节点,记录在 children 数组的对应位置上,然后沿着指针移动到子节点,继续搜索下一个字符。
重复以上步骤,直到处理字符串的最后一个字符,然后将当前节点标记为字符串的结尾。
查找前缀
我们从字典树的根开始,查找前缀。对于当前字符对应的子节点,有两种情况:
- 子节点存在。沿着指针移动到子节点,继续搜索下一个字符。
- 子节点不存在。说明字典树中不包含该前缀,返回空指针。
重复以上步骤,直到返回空指针或搜索完前缀的最后一个字符。
若搜索到了前缀的末尾,就说明字典树中存在该前缀。此外,若前缀末尾对应节点的 isEnd 为真,则说明字典树中存在该字符串。
代码实现
class Trie{
private:
vector<Trie*> children;
bool isEnd;
Trie* searchPrefix(string prefix){
Trie* node=this;
for(char ch : prefix){
ch-='a';
if(node->children[ch]==nullptr){
return nullptr;
}
node=node->children[ch];
}
return node;
}
public:
Trie(): children(26),isEnd(false){}
void insert(string word){
Trie* node=this;
for(char ch :word){
ch-='a';
if(node->children[ch]==nullptr){
node->children[ch]=new Trie();
}
node = node->children[ch];
}
node->isEnd=true;
}
bool search(string word){
Trie* node = this->searchPrefix(word);
return node !=nullptr && node->isEnd;
}
bool startsWith(string prefix){
return this->searchPrefix(prefix)!=nullptr;
}
};
时间复杂度:初始化为 O(1),其余操作为 O(∣S∣),其中 |S| 是每次插入或查询的字符串的长度。
空间复杂度:O(∣T∣⋅Σ),其中 |T|为所有插入字符串的长度之和,Σ 为字符集的大小,本题Σ=26。
参考来源
作者:LeetCode-Solution
链接:https://leetcode-cn.com/problems/implement-trie-prefix-tree/solution/shi-xian-trie-qian-zhui-shu-by-leetcode-ti500/
来源:力扣(LeetCode)