HanLP 1.7.3 发布了。HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 在提供丰富功能的同时,HanLP 内部模块坚持低耦合、模型坚持惰性加载、服务坚持静态提供、词典坚持明文发布,使用非常方便,同时自带一些语料处理工具,帮助用户训练自己的模型。
新版更新内容:
1.感知机词法分析器默认使用98年人民日报6个月的大模型
2.优化DoubleArrayTrie fix #1136
3.防止ViterbiSegment.dat不必要的初始化
4.修复词法分析器对动态插入的词条的处理 fix #271 (comment)
5.词法分析器seg接口支持自定义词性覆盖统计词性 fix #1156
6.修订拼音
7.新数据包data-for-1.7.3.zip md5=4e4f3695565a75b56427ba4a40731949
8.Portable版同步升级到v1.7.3
<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.7.3</version>
</dependency>