文章目录
Trie树的介绍
Trie称为前缀树或者是字典树,用于判断字符串是否存在或者是否具有某种字符串的前缀。是一棵非典型的多叉树模型,经常用来快速检索。
前缀树里面存储的是具有相同前缀的字符串。
Trie的节点结构
Trie是一个有根的树,其节点具有以下字段:
- 最多R个指向子节点的链接,其中每个链接对应字母表数据集中的一个字母。
- 布尔字段:来指定节点是对应键的结尾还是只是键前缀。
Trie树的两个常见操作
向Trie树中插入键
通过搜索Trie树来插入一个键,从根节点开始搜索它对应于第一个键字符的链接,有两种情况:
- 链接存在。沿着链接移动到树的下一层。算法继续搜索下一个键字符。
- 链接不存在。创建一个新节点,并将它与父节点的链接相连,该链接与当前的键字符相匹配。
重复以上的步骤直到到达键的最后一个字符,然后将当前节点标记为结束节点,算法结束。
复杂度分析:
时间复杂度:O(m),其中m为键长。在算法的每次迭代中,我们要么创建一个节点直到到达键尾,只需要m次操作。
空间复杂度:O(m),最坏的情况下,新插入的键和Trie树中已经有的键没有公共前缀,此时要添加m个节点,使用O(m)空间。
在Trie树中查找键
**每个键在trie中表示从根节点到内部节点或者叶子节点的路径。**用第一个键字符从根开始,检查当前节点中与键字符对应的链接。有两种情况:
- 存在链接。我们移动到该链接后面路径中的下一个节点,并继续搜索下一个键字符。
- 不存在链接。若已无键字符,且当前节点标记为
isEnd
,则返回true
。否则有两种可能,均返回false
:
(1) 还有键字符剩余,但无法跟随树的键路径,找不到键。
(2)没有键字符剩余,但当前节点没有标记为isEnd
,也就是说,待查找键只是Trie树中的另一个键的前缀。
复杂度分析:
时间复杂度:O(m),算法的每一步均搜索下一个键字符,最坏的情况下需要m次操作。
空间复杂度:O(1)。
查找Trie树中的键前缀
该方法与在Trie树中搜索键时使用的方法相似。我们从根遍历Trie树,直到键前缀中没有字符,或者无法用当前的键继续Trie中的路径。与上面提到的"搜索键”算法的唯一区别是,到达键前缀的末尾时,总是返回true
.我们不需要考虑当前Trie节点是否使用isEnd
标记,因为我们搜索的是键的前缀,而不是整个键。
复杂度分析
时间复杂度:O(m)
空间复杂度:O(1)
Trie树的优势
字典树优于哈希表的原因为:
尽管哈希表能够在O(1)时间内寻找键值,但是无法高效的完成:
- 找到具有同一前缀的全部键值。
- 按字典序枚举字符串的数据集。
同时,随着哈希表大小增加,会出现大量的冲突,时间复杂度可能增加到O(n),其中n是插入键的数量,与哈希表相比,Trie树在存在多个相同前缀的键时可以使用较少的空间,此时Trie树只需要O(m)的时间复杂度,其中m为键长,而在平衡树中查找键值需要O(mlogn)时间复杂度。
677.键值映射
题目大意
实现一个 MapSum 类,支持两个方法,insert 和 sum:
MapSum() 初始化 MapSum 对象
void insert(String key, int val) 插入 key-val 键值对,字符串表示键 key ,整数表示值 val 。如果键 key 已经存在,那么原来的键值对将被替代成新的键值对。
int sum(string prefix) 返回所有以该前缀 prefix 开头的键 key 的值的总和。
解题思路
- 往前缀树中插入键值对:
依次取出字符串(键)中的每个字符递归的进行插入,计算每个字符对应的索引,创建孩子节点进行插入,当把所有的字符都插入的时候,就将最后一个节点的值进行更新。 - 计算以某个前缀 开头键所对应的值的总和:
同上面递归的找值,然后还要查看已找到节点的孩子节点中是否还有值,同样要加到最终的总和中去。
代码实现
class MapSum {
private class Node{
Node[] childs=new Node[26];
int value;
}
private Node root=new Node();
/** Initialize your data structure here. */
public MapSum() {
}
public void insert(String key, int val) {
insert(key,root,val);
}
public void insert(String key,Node node,int val){
//往根为node的前缀树中插入键值对(key,val)
//如果整棵树为空 直接返回
if(node==null){
return ;
}
//如果插入的字符串长度为0,将值进行更换
if(key.length()==0){
node.value=val;
return ;
}
int index=IndexForChar(key.charAt(0));
if(node.childs[index]==null){
node.childs[index]=new Node();
}
insert(key.substring(1),node.childs[index],val);
}
public int sum(String prefix) {
return sum(prefix,root);
}
//表示以node为结束的字符串中
public int sum(String prefix,Node node){
//返回所有以prefix为前缀的value值和
if(node==null){
return 0;
}
if(prefix.length()!=0){
int index=IndexForChar(prefix.charAt(0));
return sum(prefix.substring(1),node.childs[index]);
}
int sum=node.value;
//查看以孩子节点为开始是否有以prefix为前缀的字符串
for(Node child:node.childs){
sum+=sum(prefix,child);
}
return sum;
}
private int IndexForChar(char c){
return c-'a';
}
}
208. 实现 Trie (前缀树)
题目大意
实现一个 Trie (前缀树),包含 insert, search, 和 startsWith 这三个操作。
解题思路
insert()
:
同上题的插入操作。只是当插入完字符串的时候,不是更新节点的值了,而是将节点标记为叶子节点。search():
递归的进行搜索,当搜索的键长度为0时,查看对应的节点是否为叶子节点。startsWith()
:
同上面的搜索操作,只是当前缀的长度为0的时候就返回true
,表示存在该前缀的字符串。
代码实现
class Trie {
private class Node{
Node[] childs=new Node[26];
boolean isLeaf;
}
private Node root=new Node();
/** Initialize your data structure here. */
public Trie() {
}
/** Inserts a word into the trie. */
public void insert(String word) {
insert(word,root);
}
public void insert(String word,Node node){
if(node==null){
return ;
}
if(word.length()==0){
node.isLeaf=true;
return ;
}
//获取索引
int index=indexForChar(word.charAt(0));
//如果该处没有值就创建一个节点
if(node.childs[index]==null){
node.childs[index]=new Node();
}
//递归继续插入剩下的字符串
insert(word.substring(1), node.childs[index]);
}
/** Returns if the word is in the trie. */
public boolean search(String word) {
return search(word,root);
}
public boolean search(String word,Node node){
if(node==null){
return false;
}
if(word.length()==0){
return node.isLeaf;
}
int index=indexForChar(word.charAt(0));
return search(word.substring(1),node.childs[index]);
}
/** Returns if there is any word in the trie that starts with the given prefix. */
public boolean startsWith(String prefix) {
return startsWith(prefix,root);
}
public boolean startsWith(String prefix,Node node){
if(node==null){
return false;
}
if(prefix.length()==0){
return true;
}
int index=indexForChar(prefix.charAt(0));
return startsWith(prefix.substring(1),node.childs[index]);
}
public int indexForChar(char c){
return c-'a';
}
}