为了准备阿里的网上笔试,这几天回顾了数据结构.看到字典树时,突然发现四六级的高频词可以用字典树找出来的.(应该不会是一个一个数出来的吧....)
构造字典树的过程如下:
1.首先确定树节点需要用怎么样的数据结构,我是这样写的:
public class TrieTreeNode {
/**
* 节点深度
*/
public short depth;
/**
* 存放当前节点的所有子节点
*/
public Map<Integer, TrieTreeNode> children = new HashMap<Integer, TrieTreeNode>();
/**
* 是否为单词的结尾
*/
public boolean isTail = false;
/**
* 双亲节点
*/
public TrieTreeNode parent;
/**
* 可以是a-z中的任意字母
*/
public char value;
/**
* 当单词相同时,wordCount++,用于计算相同的单词个数
*/
public int wordCount = 0;
/**
* 存放一整个单词
*/
public StringBuilder word = new StringBuilder();
public TrieTreeNode() {
// TODO Auto-generated constructor stub
}
}
2.通过节点的parent,children属性,来连接各个节点.每一个单词开始,都先将root节点作为双亲节点,单词中的每个字符来构造子节点,如果子节点存在,则直接使用,否则新建.
/**
* 通过给定的字符串创建字典树,暂时只支持英文
* @param data 用于创建字典树的字符串,暂不支持中文.
*/
publ