- 博客(1)
- 收藏
- 关注
原创 结巴分词 java 高性能实现,优雅易用的 api 设计,性能优于 huaban jieba 分词
SegmentSegment 是基于结巴分词词库实现的更加灵活,高性能的 java 分词实现。 变更日志创作目的分词是做 NLP 相关工作,非常基础的一项功能。jieba-analysis 作为一款非常受欢迎的分词实现,个人实现的 opencc4j 之前一直使用其作为分词。但是随着对分词的了解,发现结巴分词对于一些配置上不够灵活。(1)有很多功能无法指定关闭,比如 HM...
2024-02-02 12:53:19 563 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人