前缀树又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。
前缀树
1)单个字符串中,字符从前到后的加到一棵多叉树上
2)字符放在路上,节点上有专属的数据项(常见的是pass和end值)
3)所有样本都这样添加,如果没有路就新建,如有路就复用
4)沿途节点的pass值增加1,每个字符串结束时来到的节点end值增加1
可以完成前缀相关的查询
前缀树一般有两种表现形式,一种是字母在节点上,一种是字母在路径上。区别也不大。如图:

图来自@五分钟学算法之Trie树
还有另外一种表示,表示在路径上,然后节点用Pass 和End 分别表示 有多少个字符串经过该节点,和有多少个字符串是以当前节点为终点。
例如 [“abc”,“abd”,“bce”,“abcd”,“bcf”] 这个字符串用trie表示的话则

其实就是很简单:沿途P++,最后e++
这样有什么好处呢?
当我们想找 abc 出现了几次 =>直接看 c 后边的节点e 值是多少。
当我们想找 ab 做前缀出现了几次 =》直接看b 后的节点 p 值是多少即可
优势
比HashMap 强的地方是,HashMap 不能直接查到以谁为前缀出现了多少次。
例子
设计一种结构。用户可以:
1)void insert(String str) 添加某个字符串,可以重复添加,每次算1个
2)int search(String str) 查询某个字符串在结构中还有几个
3) void delete(String str) 删掉某个字符串,可以重复删除,每次算1个
4)int prefixNumber(String str) 查询有多少个字符串,是以str做前缀的
前缀树路的实现方式
题目1: [ 固定数组实现前缀树 ] (只含26个字母拼接的字符串)
package mytx.class08;
public class Code_TrieTree {
public static class Node {
int pass;
int end;
Node[] next;
public Node() {
this.end = 0;
this.pass = 0;
this.next = new Node[26];//
}
public class Trie {
Node root;
public Trie() {
this.root = new Node();
}
public void insert(String str) {
if (str == null && str.length() == 0) {
return;
}
char[] chars = str.toCharArray();
Node cur = this.root;
cur.pass++;
for (int i = 0; i < chars.length; i++) {
int index = chars[i] - 'a';
if (cur.next[index] == null) {
cur.next[index] = new Node();
}
cur = cur.next[index];
cur.pass++;
}
cur.end++;
}
public void delete(String str) {
if (str == null && str.length() == 0) {
return;
}
char[] chars = str.toCharArray();
Node cur = this.root;
cur.pass--;
for (int i = 0; i < chars.length; i++) {
int index = chars[i] - 'a';
if (cur.next[index] == null) {
return;
}
cur.pass--;
cur = cur.next[index];
}
cur.end--;
}
//返回最后一个节点的pass
public int getPreCount(String str) {
if (str == null && str.length() == 0) {
return 0;
}
char[] chars = str.toCharArray();
Node cur = this.root;
for (int i = 0; i < chars.length; i++) {
int index = chars[i] - 'a';
if (cur.next[index] == null) {
return 0;
}
cur = cur.next[index];
}
return cur.pass;
}
}
}
}
本周打卡记录
这周开始刷前缀树和链表,对比之前自己刷链表,明显感觉刷同样的题,这次感觉比之前容易了很多。链表题需要多练习,也需要找准边界条件。用简单的123 节点能帮助做很多节点的判断。
第五周进度: 应刷 14 道,实刷 10 道。用时11h

[ 最大线段重合问题-堆实现|最大线段重合问题 ] 打卡 2022-05-10
[ 手写加强堆 ] 打卡 2022-05-11
[ 手写trie树 ] 打卡 2022-05-13
[ 有限范围内桶排序 ] 打卡 2022-05-14
[ 有限范围内桶排序 优化(10个桶,每位复用) ] 打卡 2022-05-14
[ 链表中点 (偶数中点则选前边为中点)] 打卡 2022-05-15
[ 链表中点 (偶数中点则选后边为中点)] 打卡 2022-05-15
[ 链表中点前一个(偶数中点则选 前边 为中点) ] 打卡 2022-05-15
[ 链表中点前一个(偶数中点则选 后边 为中点) ] 打卡 2022-05-15
[ 判断链表是否为回文结构(用stack) ] 打卡 2022-05-15
[ 判断链表是否为回文结构(利用链表之间进行操作) ] 打卡 2022-05-15
[ 将单向链表按某值划分成左边小、中间相等、右边大的形式 ]
[ 链表改序问题 ]
[ 深度复制带有rand指针的链表 ]
本文介绍了前缀树(Trie树)的构造原理,展示了如何通过固定数组实现在字符串操作中的高效查询,包括插入、删除和前缀计数。重点讲解了其在查找和前缀统计上的优势,并通过实例说明了如何使用Trie树解决相关问题。

被折叠的 条评论
为什么被折叠?



