Trie(发音类似 “try”)或者说 前缀树 是一种树形数据结构,用于高效地存储和检索字符串数据集中的键。这一数据结构有相当多的应用情景,例如自动补完和拼写检查。
请你实现 Trie 类:
Trie() 初始化前缀树对象。
- void insert(string word) 向前缀树中插入字符串 word 。
- bool search(string word) 如果字符串 word 在前缀树中,返回 true(即,在检索之前已经插入);否则,返回 false 。
- bool startsWith(string prefix) 如果之前已经插入的字符串 word 的前缀之一为 prefix ,返回 true ;否则,返回 false 。
示例:
输入
[“Trie”, “insert”, “search”, “search”, “startsWith”, “insert”, “search”]
[[], [“apple”], [“apple”], [“app”], [“app”], [“app”], [“app”]]
输出
[null, null, true, false, true, null, true]
解释
Trie trie = new Trie();
trie.insert(“apple”);
trie.search(“apple”); // 返回 True
trie.search(“app”); // 返回 False
trie.startsWith(“app”); // 返回 True
trie.insert(“app”);
trie.search(“app”); // 返回 True
思路一:二维数组
Trie树(又叫前缀树或者字典树)是一种用于快速查询某个字符串、字符前缀是否存在的数据结构。
其核心是使用边来代表有无字符,使用点来记录是否为单词结尾以及其后续字符串是什么。
一个朴素的想法是直接使用二维数组来实现Trie树。
- 使用二维数组trie[]来存储我们所有的单词字符。
- 使用index来自动增加记录我们到底用了多少个格子(相当于给被用到格子进行编号)。
- 使用count[]数组记录某个格子被标记为结尾的次数(当idx编号的格子被标记了n次,则有cnt[idx] == n)
const int maxn = 1e5 + 50;
bool vis[maxn];
int son[maxn][26],idx;
class Trie {
public:
Trie() {
memset(vis,false,sizeof vis);
memset(son,0,sizeof son);
idx = 0;
}
void insert(string word) {
int p = 0;
for(auto x : word){
int u = x - 'a';
if(!son[p][u]) son[p][u] = ++idx;
p = son[p][u];
}
vis[p] = true;
}
bool search(string word) {
int p = 0;
for(auto x : word){
int u = x - 'a';
if(!son[p][u]) return false;
p = son[p][u];
}
return vis[p];
}
bool startsWith(string prefix) {
int p = 0;
for(auto x : prefix){
int u = x - 'a';
if(!son[p][u]) return false;
p = son[p][u];
}
return true;
}
};
思路二:建立TrieNode结构节点
随着数据的不断插入,根据需要不断创建TrieNode节点。
class Solution{
private:
Trie* son[26];
bool isWord;
public:
Trie() {
isWord = false;
for (int i = 0; i < 26; i++) son[i] = nullptr;
}
~Trie(){
for (int i = 0; i < 26; i++)
{
if (son[i] != nullptr) delete son[i];
}
}
void insert(string word)
{
// this指针!!
Trie* root = this;
for (char x : word) {
int cur = x - 'a';
if (root -> son[cur] == nullptr) root -> son[cur] = new Trie();
root = root -> son[cur];
}
root -> isWord = true;
}
bool search(string word)
{
Trie* root = this;
for (char x : word)
{
int cur = x - 'a';
if (root -> son[cur] == nullptr) return false;
root = root -> son[cur];
}
return root -> isWord;
}
bool startsWith(string prefix)
{
Trie* root = this;
for(char x : prefix)
{
int cur = x - 'a';
if (root -> son[cur] == nullptr) return false;
root = root -> son[cur];
}
return true;
}
};
复杂度分析
- 时间复杂度:Trie 树的每次调用时间复杂度取决于入参字符串的长度。复杂度为 O(Len)。
- 空间复杂度:结点数量为 n,字符集大小为 k。复杂度为 O(nk)。
思路三:链式+map的方式实现
// 字典树的节点结构我采用链式+map的方式实现,每个字符映射一个节点,用布尔标记是否是一个完整单词。
struct Node
{
map<char,Node*> next;
bool f=false;
};
class Trie {
public:
Node * head;
/** Initialize your data structure here. */
Trie() {
head=new Node();
}
/** Inserts a word into the trie. */
// 插入的时候我们从头节点开始查询是否存在目标字符到目标节点的映射,如果不存在我们需要创建新节点。并且在最后一个目标字符的时候设置标记。
void insert(string word) {
Node * t=head;
for(char c:word)
{
if(t->next[c]==NULL)
{
Node* n=new Node;
t->next[c]=n;
}
t=t->next[c];
}
t->f=true;
}
/** Returns if the word is in the trie. */
// 查询的时候我们就根据目标字符和对应节点的映射遍历,如果是查询单词遍历到最后,需要检查标记。
bool search(string word) {
Node * t=head;
for(char c:word)
{
if(t->next[c]==NULL)
{
return false;
}
t=t->next[c];
}
return t->f;
}
/** Returns if there is any word in the trie that starts with the given prefix. */
bool startsWith(string prefix) {
Node * t=head;
for(char c:prefix)
{
if(t->next[c]==NULL)
{
return false;
}
t=t->next[c];
}
return true;
}
};