本体开发日记07-我与java分词组件的爱恨情仇-DictSegment类

1.词典树分段,表示词典树的一个分枝?啥是词典树?package com.huaban.analysis.jieba;import java.util.Arrays;import java.util.HashMap;import java.util.Map;上面是引用!class DictSegment implements Comparable<DictSegment>这个类实现了一个接口:Comparable讲解:https://www.cnblogs.com/walt
摘要由CSDN通过智能技术生成

1.词典树分段,表示词典树的一个分枝?啥是词典树?

package com.huaban.analysis.jieba;
import java.util.Arrays;
import java.util.HashMap;
import java.util.Map;

上面是引用!

class DictSegment implements Comparable<DictSegment>

这个类实现了一个接口:Comparable

讲解:https://www.cnblogs.com/walter371/p/5197511.html
讲解:https://blog.csdn.net/weixin_43505709/article/details/87908756

不知道这个接口是干啥的!
在这里插入图片描述

 // 公用字典表,存储汉字
 private static final Map<Character, Character> charMap = new HashMap<Character, Character>(16, 0.95f);   
// 数组大小上限
private static final int ARRAY_LENGTH_LIMIT = 3;
// Map存储结构
 private Map<Character, DictSegment> childrenMap;   
// 数组方式存储结构
private DictSegment[] childrenArray;
// 当前节点上存储的字符
private Character nodeChar;
// 当前节点存储的Segment数目storeSize <=ARRAY_LENGTH_LIMIT ,使用数组存储, storeSize >ARRAY_LENGTH_LIMIT,则使用Map存储
private int storeSize = 0;
// 当前DictSegment状态 ,默认 0 , 1表示从根节点到当前节点的路径表示一个词
 private int nodeState = 0;

上面都是提前定义好的参数!这个java基础要很好才行!我步行!!

DictSegment(Character nodeChar) {
   
        if (nodeChar == null) {
   
            throw new IllegalArgumentException("参数为空异常,字符不能为空");
        }
        this.nodeChar = nodeChar;
    }
Character getNodeChar() {
   
        return nodeChar;
    }

这个首先要提取nodeChar!

boolean hasNextNode() {
   
        return this.storeSize > 0;
    }

判断是否有下一个节点!

Hit match(char[] charArray) {
   
        return this.match(charArray, 0, charArray.length, null);
    }
Hit match(char[] charArray, int begin, int length) {
   
        
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值