剑指 Offer II 062 | 实现前缀树
Trie(发音类似 “try”)或者说 前缀树 是一种树形数据结构,用于高效地存储和检索字符串数据集中的键。这一数据结构有相当多的应用情景,例如自动补完和拼写检查。
请你实现 Trie 类:
- Trie() 初始化前缀树对象。
- void insert(String word) 向前缀树中插入字符串 word 。
- bool search(String word) 如果字符串 word 在前缀树中,返回 true(即,在检索之前已经插入);否则,返回 false 。
- bool startsWith(String prefix) 如果之前已经插入的字符串 word 的前缀之一为 prefix ,返回 true ;否则,返回 false 。
示例:
输入
inputs = ["Trie", "insert", "search", "search", "startsWith", "insert", "search"]
inputs = [[], ["apple"], ["apple"], ["app"], ["app"], ["app"], ["app"]]
输出
[null, null, true, false, true, null, true]
解释
Trie trie = new Trie();
trie.insert("apple");
trie.search("apple"); // 返回 True
trie.search("app"); // 返回 False
trie.startsWith("app"); // 返回 True
trie.insert("app");
trie.search("app"); // 返回 True
提示:
- 1 <= word.length, prefix.length <= 2000
- word 和 prefix 仅由小写英文字母组成
- insert、search 和 startsWith 调用次数 总计 不超过 3 * 104 次
思路:利用前缀树的思想来做
Trie,又称前缀树或字典树,是一棵有根树,其每个节点包含以下字段:
- 指向子节点的指针数组 children。对于本题而言,数组长度为 26,即小写英文字母的数量。此时 children[0] 对应小写字母 a,children[1] 对应小写字母 b,…,children[25] 对应小写字母 z。
- 布尔字段 isEnd,表示该节点是否为字符串的结尾。
class Trie {
public:
/** Initialize your data structure here. */
Trie() : children(26), isEnd(false) {}
/** Inserts a word into the trie. */
void insert(string word) {
Trie* node = this;
for (int i = 0; i < word.size(); i++) {
int index = word[i] - 'a';
if (node->children[index] == nullptr) {
node->children[index] = new Trie();
}
node = node->children[index];
}
node->isEnd = true;
}
/** Returns if the word is in the trie. */
bool search(string word) {
Trie* node = this;
for (int i = 0; i < word.size(); i++) {
int index = word[i] - 'a';
if (node->children[index] == nullptr)
return false;
node = node->children[index];
}
return node->isEnd;
}
/** Returns if there is any word in the trie that starts with the given prefix. */
bool startsWith(string prefix) {
Trie* node = this;
for (int i = 0; i < prefix.size(); i++) {
int index = prefix[i] - 'a';
if (node->children[index] == nullptr)
return false;
node = node->children[index];
}
return true;
}
private:
vector<Trie*> children;
bool isEnd;
};
// 提取出重复的代码后如下:
class Trie {
private:
vector<Trie*> children;
bool isEnd;
Trie* searchPrefix(string word){
auto node = this;
for (char ch : word) {
ch -= 'a';
if (!node->children[ch]) {
return nullptr;
}
node = node->children[ch];
}
return node;
}
public:
Trie() : children(26), isEnd(false) {}
void insert(string word) {
auto node = this;
for (char ch : word) {
ch -= 'a';
if (!node->children[ch]) {
node->children[ch] = new Trie();
}
node = node->children[ch];
}
node->isEnd = true;
}
bool search(string word) {
auto node = searchPrefix(word);
return node && node->isEnd == true;
}
bool startsWith(string prefix) {
return searchPrefix(prefix);
}
};