IkAnalyzer分词后文章字符全角变半角，字母大写变小写问题

最新推荐文章于 2022-10-14 16:29:28 发布

Bazinga_fine

最新推荐文章于 2022-10-14 16:29:28 发布

阅读量1.1k

点赞数

分类专栏： Java 文章标签： java IK 源码

Java 专栏收录该内容

21 篇文章 0 订阅

订阅专栏

最近在项目中药用到IK分词对文章进行分词，但是却遇到了分出来的词由大写变小写的问题，下面贴出解决方式：

打开ik的源码包org.wltea.analyzer.core.CharacterUtil类里
有个方法叫regularize 该方法的作用是进行字符规格化（全角转半角，大写转小写处理）
显然把这个方法注释就好了，并且去掉相关引用地方的该方法调用
这样ik分词出来的字符就保留原先的完整性了

补充：在进行分词时候，有的时候我们只需要返回匹配的词语，而且进行匹配的词库也是我们自己定义的，这时候如果需要保持大小写就需要再次修改一下源码

具体修改位置是在/IKAnalyzerDev/src/org/wltea/analyzer/dic/Dictionary.java类中，将源码的toLowCase（）全部注释即可！

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
IkAnalyzer分词后文章字符全角变半角，字母大写变小写问题

最近在项目中药用到IK分词对文章进行分词，但是却遇到了分出来的词由大写变小写的问题，下面贴出解决方式：打开ik的源码包org.wltea.analyzer.core.CharacterUtil类里有个方法叫regularize 该方法的作用是进行字符规格化（全角转半角，大写转小写处理）显然把这个方法注释就好了，并且去掉相关引用地方的该方法调用这样ik分词出来的字符
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。