![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Lucene
学无止路
积极向上,坚持不懈的奋斗!
展开
-
查看分析器的分析效果
查看分析器的分析效果 1.查看分析器的分析效果 默认使用标准分析器StandardAnalyzer。 1).查看分析器分析效果的步骤如下: a.直到IndexWriterConfig,Ctrl+鼠标左键。 b.进入如图所示的界面,并Ctrll+鼠标左键。点击StandardAnalyzer。 c.进入如图所示的界面,并Ctrll+鼠标左键。点击 StopwordAnalyzerBase . d.进入如图所示的界面,说明所有的分析器都继承Analyzer分析器抽象类。 使用Analyzer对象的TokenSt原创 2020-10-19 10:02:10 · 231 阅读 · 0 评论 -
索引库维护
索引库维护 1 添加文档 实现代码如下: package com.txw.lucene; import org.apache.lucene.document.Document; import org.apache.lucene.document.Field; import org.apache.lucene.document.StoredField; import org.apache.lucene.document.TextField; import org.apache.lucene.index.In原创 2020-10-19 09:55:51 · 119 阅读 · 0 评论 -
全文检索基本介绍
全文检索基本介绍 1 全文检索的概念 先创建索引然后再查询索引的过程就做全文检索。 1.1 数据分类 我们生活中的数据总体分为两种:结构化数据和非结构化数据。 结构化数据:指具有固定格式或有限长度的数据,如数据库,元数据等。 非结构化数据:指不定长或无固定格式的数据,如邮件,word文档等磁盘上的文件。 1.2 结构化数据搜索 常见的结构化数据也就是数据库中的数据。在数据库中搜索很容易实现,通常都是使用sql语句进行查询,而且能很快的得到查询结果。 为什么数据库搜索很容易? 因为数据库中的数据存储是有规律原创 2020-10-19 09:43:05 · 4455 阅读 · 0 评论 -
中文分析器
中文分析器 1 中文分析器介绍 1.IKAnalyzer的使用方法 a.把IKAnalyzer的jar添加到工程中。如图所示: b.把配置文件和扩展词典添加到工程的Classpath目录下。如图所示: 添加到src目录下,如图所示: 注意事项:扩展词典严禁Windows记事本编辑的,保证扩展词典的编码格式是UTF-8的。 因为Window记事本UTF+BOM的编码格式,不会生效。 扩展词典:添加一些新词。 停用词词典:敏感词汇或者是无意义的词。 2 中文分析器测试 测试代码如下: package com.t原创 2020-10-19 09:34:42 · 266 阅读 · 0 评论