字典树入门及实现_JAVA

Trie树,又称单词查找树或键树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。

 

它的优点是:

  利用字符串的公共前缀来节约存储空间,最大限度的减少无谓的字符串比较,查询效率比哈希表高。

  比如说我们想储存3个单词,skyskylineskymoon。如果只是单纯的按照以前的字符数组存储的思路来存储的话,那么我们需要定义三个字符串数组。但是如果我们用字典树的话,只需要定义一个树就可以了。在这里我们就可以看到字典树的优势了。

 

它有三个基本性质:

(1)根节点不包含字符;

(2) 除根节点外每一个节点都只包含一个字符:

(3) 从根节点到某一节点,路径上经过的字符连接起来,为该节点对应的字符串,每个节点的所有子节点包含的字符都不相同。


 


字典树的插入,删除和查找都非常简单,用一个一重循环即可。

1.从根节点开始一次搜索

2.取得要查找关键词的第一个字母,并根据该字母选择对应的子树并转到该子树继续进行检索

3.在相应的子树上,取得要查找关键词的第二个字母,并进一步选择对应的子树进行检索

4.迭代过程...

5.在某个节点处,关键词的所有字母已被取出,则读取附在该节点上的信息,即完成查找

:

   Ignatius最近遇到一个难题,老师交给他很多单词(只有小写字母组成,不会有重复的单词出现),现在老师要他统计出以某个字符串为前缀的单词数量(单词本身也是自己的前缀). 

 

Input 

  输入数据的第一部分是一张单词表,每行一个单词,单词的长度不超过10,它们代表的是老师交给Ignatius统计的单词,一个空行代表单词表的结束.第二部分是一连串的提问,每行一个提问,每个提问都是一个字符串.注意:本题只有一组测试数据,处理到文件结束

 

Output 

对于每个提问,给出以该字符串为前缀的单词的数量

 

Sample Input 

banana 

band 

bee 

absolute 

acm 

 

ba 

band 

abc 

 

Sample Output 

 

代码: (字典树模板)

import java.util.LinkedList; 
public class Trie {    
    private int SIZE = 26;
    private TrieNode root;  //字典树的根
 
    Trie() {  //初始化字典树
        root = new TrieNode(); 
    } 
 
    private class TrieNode {  //字典树节点
        private intnum;//有多少单词通过这个节点,即节点字符出现的次数
        private TrieNode[] son;//所有的儿子节点
        private booleanisEnd;//是不是最后一个节点
        private char val;// 节点的值
       
 
        TrieNode() { 
            num = 1;
            son = newTrieNode[SIZE]; 
            isEnd = false; 
          
        } 
    } 
  //建立字典树
    public void insert(String str) {  //在字典树中插入一个单词
        if (str == null || str.length()== 0) { 
            return;
        } 
        TrieNode node = root; 
        char[] letters=str.toCharArray(); 
        for (int i = 0, len =str.length(); i < len; i++) { 
            int pos = letters[i] -'a'; 
            if (node.son[pos] == null){ 
                node.son[pos] = newTrieNode(); 
                node.son[pos].val =letters[i]; 
            } else { 
                node.son[pos].num++;
            } 
            node = node.son[pos]; 
        } 
        node.isEnd = true; 
    } 
 
    
    public int countPrefix(Stringprefix){  //计算单词前缀的数量
       if(prefix==null||prefix.length()==0){ 
            return -1; 
        } 
        TrieNode node=root; 
        char[]letters=prefix.toCharArray(); 
        for(inti=0,len=prefix.length();i< len;i++){ 
            int pos=letters[i]-'a'; 
            if(node.son[pos]==null){ 
                return 0; 
            }else{ 
                node=node.son[pos]; 
            } 
        } 
        return node.num; 
    } 
     
    // 在字典树中查找一个完全匹配的单词. 
    public boolean has(String str) { 
        if (str == null || str.length()== 0) { 
            return false; 
        } 
        TrieNode node = root; 
        char[] letters=str.toCharArray(); 
        for (int i = 0, len =str.length(); i < len; i++) { 
            int pos = letters[i] -'a'; 
            if (node.son[pos] != null){ 
                node =node.son[pos]; 
            } else { 
                return false; 
            } 
        } 
        return node.isEnd; 
    } 
 
   
    //前序遍历字典树. 
    public void preTraverse(TrieNodenode){ 
        if(node!=null){ 
           System.out.print(node.val+"-"); 
            for(TrieNode child:node.son){ 
                preTraverse(child); 
            } 
        } 
         
    } 
  
    public TrieNode getRoot(){ 
        return this.root; 
    } 
     
    public static void main(String[]args) { 
        Trie tree = new Trie(); 
        String[] strs={ 
                "banana",
               "band",
               "bee",
               "absolute",
               "acm",
        };
        String[] prefix={
                "ba",
                "b",
               "band",
                "abc",
        };
        for(String str : strs){ 
            tree.insert(str);
        } 
       System.out.println(tree.has("abc")); 
       tree.preTraverse(tree.getRoot()); 
        System.out.println(); 
        //tree.printAllWords(); 
        for(String pre : prefix){ 
            intnum=tree.countPrefix(pre); 
            System.out.println(pre+""+num); 
        } 
         
    } 

运行: 

 

来自 <http://www.java3z.com/cwbwebhome/article/article8/83591.html?id=4750


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值