lucene
yilia_jia
这个作者很懒,什么都没留下…
展开
-
java——lucene实现全文检索(一)建立索引
需求:对多个文档内的数据进行全文检索(文档包括.txt .doc .docx .pdf) 1.对各个文档建立索引 2.对索引进行搜索 各个依赖: <!-- lucene 核心模块 --> <dependency> <groupId>org.apache.lucene</groupId> <artifactId>...原创 2019-01-24 15:18:31 · 883 阅读 · 0 评论 -
java——lucene实现全文检索(二)建立索引时分词器的选择
一篇比较完整的分词器比较文章:Lucene的各中文分词比较 StandardAnalyzer : Lucene自带的标准分析器 效果为一元分词 为了实现单字检索选择了该分词器 IKAnalyzer: 提供两种分词模式:细粒度分词和智能分词 按词拆分 能够较好的分为词 但是高版本lucene与 IKAnalyzer 冲突会报错 Exception in thread "main"...原创 2019-01-24 15:41:42 · 506 阅读 · 0 评论 -
java——lucene实现全文检索(三)查询语句
1.TermQuery 词项查询 查询指定字段包含指定词项的文档 TermQuery tq = new TermQuery(new Term("contents", "thinkPad")); 2.BooleanQuery 布尔查询 组合多个子查询 Occur.SHOULD 或 Occur.MUST 且 Occur.MUST_NOT 且非 ...转载 2019-01-24 15:46:42 · 722 阅读 · 0 评论 -
java——lucene实现全文检索(四)索引检索
将输入的查询词拆分后再传入通过短语查询进行检索 /** * * @param indexPath 索引目录 * @param searchStr 拆词后的字符集合 * @param limit 查询条数 * @throws IOException */ public static void indexSearch(String indexPath, List<String&...原创 2019-01-24 15:51:51 · 413 阅读 · 0 评论