Trie树,又称为单词查找树,一种树形结构,是哈希树的一个变种。
典型应用是用于统计、排序、和保存大量的字符串(但不限于字符串),常被搜索引擎系统用于文本词频统计
它的优点是:利用字符串的公共前缀来减少查询时间,减少无关的字符串比较,查询效率比哈希树好
它有3个基本性质:
根节点不包含字符,除根节点外每一个节点都只包含一个字符; 从根节点到某一节点,路径上经过的字符连接起来,为该节点对应的字符串; 每个节点的所有子节点包含的字符都不相同
实现方法:
搜索字典项目的方法为:
(1) 从根结点开始一次搜索;
(2) 取得要查找关键词的第一个字母,并根据该字母选择对应的子树并转到该子树继续进行检索;
(3) 在相应的子树上,取得要查找关键词的第二个字母,并进一步选择对应的子树进行检索。
(4) 迭代过程……
(5) 在某个结点处,关键词的所有字母已被取出,则读取附在该结点上的信息,即完成查找。
package pers.myprac;
import java.util.*;
//trie树的节点类
class Node {
// 记录有多少单词通过这个节点,即由根至该节点组成的字符串模式出现的次数
private int num;
// 存储孩子结点的集合,集合中元素都不重复
private HashSet<Node> son;
// 是否为最后一个结点
private boolean isEnd;
// 节点的值
private char value;
public Node() {
this.num = 1;
this.son = new HashSet<Node>();
this.isEnd = false;
}
public HashSet<Node> getSon() {
return son;
}
public char getValue() {
return value;
}
public void setValue(char ch) {
this.value = ch;
}
public int getNum(){
return num;
}
public void addNum() {
num++;
}
public boolean getIsEnd() {
return isEnd;
}
public void setIsEnd(boolean flag) {
this.isEnd = flag;
}
}
public class Trie {
private Node root;
private HashSet<String>pre = new HashSet<String>();
public Trie() {
root = new Node();
}
public Node