Trie树,又叫字典树,前缀树(prefix tree),单词查找树或键树,是一种多叉树结构
性质
1.根节点不包含字符,除根节点外的每一个节点都仅包含一个字符
2.从根节点到某一节点路径上所经过的字符连接起来,即为该节点对应的字符串
3.任意节点的所有子节点所包含的字符都不相同
常用的method
addWord(String word)
search(String word)
searchPrefix(String prefix)
模板
class Trie {
TrieNode root = new TrieNode();
public void insert(String word){
TrieNode node = root;
for(char c: word.toCharArray()){
if(node.children[c - 'a'] == null) node.children[c - 'a'] = new TrieNode();
node = node.children[c - 'a'];
}
node.isWord = true;
}
public boolean search(String word){
TrieNode node = root;
for(char c: word.toCharArray()){
if(node.children[c - 'a'] == null) return false;
node = node.children[c - 'a'];
}
return node.isWord;
}
public boolean startsWith(String prefix){
TrieNode node = root;
for(char c : prefix.toCharArray()){
if(node.children[c - 'a'] == null) return false;
node = node.children[c - 'a'];
}
return true;
}
}
class TrieNode{
TrieNode[] children = new TrieNode[26];
boolean isWord;
}
复杂度分析
1.时间复杂度
假设所有字符串长度之和为n,构建字典树的时间复杂度为O(n)
假设要查找的字符串长度为k,查找的时间复杂度为O(k)
2.空间复杂度
字典树每个节点都需要用一个数组来存储子节点的指针,即便实际只有两三个子节点,但依然需要一个完整大小的数组。所以,字典树比较耗内存,空间复杂度较高
如何优化?
可以牺牲一点查询的效率,将每个节点的子节点数组用其他数据结构代替,例如有序数组,红黑树,散列表等。例如,当子节点数组采用有序数组时,可以使用二分查找来查找下一个字符
缩点优化:将末尾一些只有一个子节点的节点,可以进行合并,但是增加了编码的难度
总结
1.高频,常考,必会
2.可以普通字典树,或者bitwise字典树
3.时间复杂度:①建立Trie O(nk),n是单词数量,k是单词长度
②搜索O(k),k是单词长度
4.空间优化可以用map代替array,缩点优化等
5.可以思考一下如果删除怎么写