IKanalyzer中文分词源码分析<一>字典的数据结构

最新推荐文章于 2024-02-07 17:03:15 发布

置顶 guwenwu285

最新推荐文章于 2024-02-07 17:03:15 发布

阅读量1.5k

点赞数

分类专栏： IKanalyzer

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/guwenwu285/article/details/9617057

版权

IKanalyzer 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

基于IK3.2.8

1，词典的加载和词典的数据结构

1.1 词典的加载

IKanalyzer的词典采用单例模式实现。

可以通过以下方法获取词典实例：

Dictionary.getInstance();

Dictionary 实例化的时候将会加载多个词典，包括：

主词典（main.dic）

姓氏词典（surname.dic）

量词词典（quantifier.dic）

后缀词典（suffix.dic）

介词\副词词典（prep.dic）

停止词词典（stopword.dic）

其中主词典、停止词词典可以通过IKAnalyzer.cfg.xml配置文件进行扩展。

1.2 词典的数据结构：

IKanalyzer 用树的结构实现詞典，每一个词典，都以空字符(char)0作为根节点，将词的第一个字做为1级子节点，第二个字作为2级子节点。如果另有一个词的第一个字与之前的词相同，则直接将词的第二个字放在第一个字下作为子节点。如果第二个字也有相同的，则把第三个字放在第二个字下作为子节点。

示意图如下：

其中，每一个节点用DictSegment实现，当节点的子节点不超过3个时，用数组来存储子节点，当子节点数量超过3个时，用HashMap来存储子节点。

同时DictSegment中有一个静态的MAP，用来存放所有的汉字。因此整个词典中的每一个字都只存放了一份，减小了词典的最终大小。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

guwenwu285 CSDN认证博客专家 CSDN认证企业博客

码龄13年

15: 原创

40万+: 周排名

55万+: 总排名

4万+: 访问

: 等级

622: 积分

10: 粉丝

3: 获赞

13: 评论

15: 收藏

私信

关注

热门文章

分类专栏

Openstack 6篇
OpenNMS 4篇
Mysql 1篇
SQLAlchemg 1篇
Linux 3篇
hadoop
IKanalyzer 1篇
Java 1篇

最新评论

Openstack中虚拟机的Resize功能详解
Tisfy: 正如大音希声扫阴翳
Openstack中虚拟机的Resize功能详解
ld462370527 回复 dns007: 谢谢您的回复！后来搞定了。修改了两行代码。你也可以参考下。 vi /usr/share/pyshared/nova/virt/libvirt/connection.py 修改2370行原： def migrate_disk_and_power_off(self, context, instance, dest, instance_type, network_info): 修改为： def migrate_disk_and_power_off(self, context, instance, dest, instance_type, network_info,shared_storage=True): 修改2383行：原： same_host = (dest == self.get_host_ip_addr()) 修改为： same_host = (shared_storage or dest == self.get_host_ip_addr())
使用virt-p2v工具将物理机迁移到Openstack虚拟机中
happyy_p: 运行完Virt-p2v-server后报 ERROR virt-v2v: Config file /var/lib/virt-v2v/virt-v2v.db doesn't exist 请问怎么解决，谢谢！！
使用virt-p2v工具将物理机迁移到Openstack虚拟机中
happyy_p: 请问下：运行 virt-p2v-server 后报找不到Tiny.pm文件，这个怎么解决，谢谢。。
Openstack中虚拟机的Resize功能详解
ld462370527: 引用「太感谢了，按照楼主的方法在共享存储在实验成功了，之前一直不成功，执行resize操作后虚拟机状态直接...」代码是在哪里改的呢？谢谢！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。