前缀树构建过程
如上图,就是前缀树,也叫做Trie树。前缀树的构建过程:
1.每当来一个字符串,就把字符串分解为一个个字符,然后,依次根据各个字符构建前缀树。比如,上图中,初始只有一个根节点,当来了ab,检查根节点下面有a这条路径吗?没有,就构建一个节点,把a作为路径,然后是b,检查a下面有b这条路径吗?也没有,那么就把b作为路径,构建一个节点。
2.此时,ab的路径已经构建好了,此时,又来了bc,先检查根节点下面有b这条路径吗?注意,此时有人会迷,其实根节点下面是没有b的,之前构建的b是在a下面的,不是根节点。然后,从根节点构建b的路径,然后再构建c。
3.此时,bd来了,先检查,根节点下面有b吗?有的,然后依次往下走,b下面有d吗?没有,那么,就在b下面再创建d。
总结:前缀树,其实本质就是一颗多叉树,然后,构建过程体现在路径上。
千万记住:前缀树最大的特征是字符在路径上体现,而不是节点内。
前缀树作用
通过前缀树的构建过程,可以大致推理出,前缀树的作用,其实主要是下面几点:
1.查找某个字符串是否存在。
如果我们把字符串在前缀树中遍历一遍,如果能够不出错,是否就是存在呢?其实当然不是,比如,前缀树中有abcd构建的一条路径,然后我们查询abc,是不是没出错啊?但是,前缀树中并没有插入过abc。这种怎么解决?这就需要在节点内,加上一个end变量,如果构建的时候以某个节点结束,那么end就加1,这样不仅能统计某个字符串是否在某个地方结束,还能统计出到底有几个相同字符串插入到前缀树中过。
结论:添加:end变量,在结束节点内+1
2.删除某条路径。
删除某条路径的话,我们如果不知道总共有多少个路径以这个路径为前缀,因此,我们需要一个path’变量,来统计这条路径在构建前缀树时到底被遍历过多少次。构建前缀树时,每个节点被遍历一次,path就加1。这样,在删除的时候,路径上的节点依次path-1,然后把结束的节点end-1,就行了。当path=0时,才说明后面没有以这个为前缀的了,此时才能真正删除。因为,你要删除的路径,很可能是其他路径的前缀,因此,当你删除某个路径时,不能影响其他路径,只能将你要删除路径的结束节点end-1。
结论:添加:path变量,每经过一次就+1,删除时,路径中全部都-1
前缀树数据结构代码实现
节点TrieNode的数据结构,用map来保存多叉树孩子节点,用path记录路径信息,用end表示结束标志。
public class TrieNode {
public int path;
public int end;
public HashMap<Character,TrieNode> nexts;
public TrieNode(){
path=0;
end=0;
nexts=new HashMap<>();
}
}
Trie树:
public class Trie {
TrieNode root=new TrieNode();
//插入
public void insert(String str){
if(str==null){
return;
}
TrieNode node=root;
char[] chars=str.toCharArray();
for (int i = 0; i < chars.length; i++) {
if(!node.nexts.containsKey(chars[i])){
node.nexts.put(chars[i],new TrieNode());
}
node=node.nexts.get(chars[i]);
node.path++;
}
node.end++;
}
//查询某个字符串出现过几次
public int search(String str){
if(str==null){
return 0;
}
TrieNode node=root;
char[] chars=str.toCharArray();
for (int i = 0; i < chars.length; i++) {
if(!node.nexts.containsKey(chars[i])){
return 0;
}
node=node.nexts.get(chars[i]);
}
return node.end;
}
//删除一条路径
public void delete(String str){
if(search(str)==0){
return;
}
TrieNode node= root;
char[] chars=str.toCharArray();
for (int i = 0; i <chars.length; i++) {
if(--node.nexts.get(chars[i]).path==0){
node.nexts.remove(chars[i]);
return;
}
node=node.nexts.get(chars[i]);
}
}
//查找所有以str为前缀的字符串数量
public int prefixNumber(String str){
if(str==null){
return 0;
}
TrieNode node=root;
char[] chars=str.toCharArray();
for (int i = 0; i < chars.length; i++) {
if(!node.nexts.containsKey(chars[i])){
return 0;
}
node=node.nexts.get(chars[i]);
}
return node.path;
}
}