大数据
王瑞恒
为了技术而努力,为了兴趣而工作.
展开
-
lucene根据document获取词频
在lucene过程中可能会遇到需要获取在单个文章中词频,可以使用一下方法:long cp = 0;TokenStream tokenStream = null;try { tokenStream = analyzer.tokenStream("neirong", new StringReader(doc.get("neirong"))); CharTermAttribut...原创 2019-09-17 18:07:46 · 426 阅读 · 0 评论 -
lucene-KAnalyzer基本用法,自定义词库
下载地址:https://github.com/wangruiheng/IK下载之后导入eclipse项目修改ext.dic文件,加入扩展词,打包上传到maven服务器,所要用的项目引入,然后使用IK分词器生成索引示例代码(生成索引):package com.lucene.doc.util;import java.nio.file.Paths;import or...原创 2019-09-17 18:27:58 · 391 阅读 · 0 评论