Lucene
学无止路
积极向上,坚持不懈的奋斗!
展开
-
查看分析器的分析效果
查看分析器的分析效果1.查看分析器的分析效果默认使用标准分析器StandardAnalyzer。1).查看分析器分析效果的步骤如下:a.直到IndexWriterConfig,Ctrl+鼠标左键。b.进入如图所示的界面,并Ctrll+鼠标左键。点击StandardAnalyzer。c.进入如图所示的界面,并Ctrll+鼠标左键。点击 StopwordAnalyzerBase .d.进入如图所示的界面,说明所有的分析器都继承Analyzer分析器抽象类。使用Analyzer对象的TokenSt原创 2020-10-19 10:02:10 · 239 阅读 · 0 评论 -
索引库维护
索引库维护1 添加文档实现代码如下:package com.txw.lucene;import org.apache.lucene.document.Document;import org.apache.lucene.document.Field;import org.apache.lucene.document.StoredField;import org.apache.lucene.document.TextField;import org.apache.lucene.index.In原创 2020-10-19 09:55:51 · 142 阅读 · 0 评论 -
全文检索基本介绍
全文检索基本介绍1 全文检索的概念先创建索引然后再查询索引的过程就做全文检索。1.1 数据分类我们生活中的数据总体分为两种:结构化数据和非结构化数据。结构化数据:指具有固定格式或有限长度的数据,如数据库,元数据等。非结构化数据:指不定长或无固定格式的数据,如邮件,word文档等磁盘上的文件。1.2 结构化数据搜索常见的结构化数据也就是数据库中的数据。在数据库中搜索很容易实现,通常都是使用sql语句进行查询,而且能很快的得到查询结果。为什么数据库搜索很容易?因为数据库中的数据存储是有规律原创 2020-10-19 09:43:05 · 4482 阅读 · 0 评论 -
中文分析器
中文分析器1 中文分析器介绍1.IKAnalyzer的使用方法a.把IKAnalyzer的jar添加到工程中。如图所示:b.把配置文件和扩展词典添加到工程的Classpath目录下。如图所示:添加到src目录下,如图所示:注意事项:扩展词典严禁Windows记事本编辑的,保证扩展词典的编码格式是UTF-8的。因为Window记事本UTF+BOM的编码格式,不会生效。扩展词典:添加一些新词。停用词词典:敏感词汇或者是无意义的词。2 中文分析器测试测试代码如下:package com.t原创 2020-10-19 09:34:42 · 278 阅读 · 0 评论