搜索引擎
学JAVA的李先生
这个作者很懒,什么都没留下…
展开
-
Lucene分词器实现停用词,常用词
在resources文件夹下创建IKAnalyzer.cfg.xml来声明停用词,常用词创建utf-8格式的 ext_dict.txt 和 ext_stopword.txt 放在与IKAnalyzer.cfg.xml同一目录下如果格式不对可以使用记事本打开然后另存为UTF-8格式原创 2022-09-27 10:21:44 · 323 阅读 · 0 评论 -
lucene7.6.0中文分词+权重设置
最近项目需要使用到中文分词,所以想到了使用lucene+ik分词来实现。使用技术为 lucene7.6.0原创 2022-08-30 14:43:27 · 842 阅读 · 0 评论