Lucene使用详情笔记

最新推荐文章于 2019-01-02 21:16:41 发布

程熙cjp

最新推荐文章于 2019-01-02 21:16:41 发布

阅读量236

点赞数

分类专栏：学习笔记文章标签： Lucene 笔记分享

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41133233/article/details/82878033

版权

学习笔记专栏收录该内容

55 篇文章 0 订阅

订阅专栏

1. 文档储存

基本流程

创建物理存储空间
创建文档对象（参数是储存物理空间,也可以是多个文档的集合类，即为创建多个文档写入）
向文档中添加字段
创建索引写出器的配置对象（分词器版本号，分词器）
创建索引写出器（第一个参数是配置对象，第二个参数是分词器）
索引写出器把文档写入物理空间内（多个文档时是：indexWriter.addDocuments(documents);）
提交
关流

如图：
文档储存
这里小熙使用的是物理硬盘上的存储空间，你也可以使用RAMDirectory将索引写入内存中。
小提示：储存的分词会直接提供给查询（如特殊查询的词条匹配查询），也是查询的必要条件

2. 文档删除

重复储存的1,4,5,6,7,8。而没有了创建文档添加字段的2,3过程，当然这也不是储存，没有是必然的。
只需在索引写出器那调用对应的删除方法即可（参数是分词器new Term(“字段”，“值”)，由此去找到对应文档删除。或者也可以是查询对象Query,只不过是对于分词包装加工更灵活了）

如图：
文档删除

3. 文档更新

其实Lucene中没有所谓的更新方法，只不是找到对应的文档先删除后添加罢了
重复存储操作，只不过在索引器时调用更新方法（第一个参数是分词器，根据分词找到对应的文档。第二个参数是需要更新的文档）

如图：
文档更新

4. 文档搜索

这个搜索的种类和方式有些多
基本流程：

创建目录对象—物理位置
创建目录读取工具
创建索引搜索工具
创建查询解析器（分查询单个字段和多个字段）
创建查询对象
查询文档记录对象
查询击中数
获取得分文档
读取对应ID的文档

基本查询
如图：
基本查询文档
在此之后我们可以把基本查询的查询对象Query提成方法参数，修改为传参的Search方法。

特殊查询

特殊查询，基于基础查询上拓展的功能。还是基于基本查询代码，只是把查询对象替换成了专职的Query对象。
在此小熙列举的特殊查询相较于基本查询少了分词器的使用（可根据储存时的分词查找），也就少了些查询灵活性，但功能和便捷性还是很大的。
词条匹配查询：

通配符搜索：

模糊查询：

范围查询：

布尔查询（综合查询）：

5. 结果排序

对于查询结果排序，只是添加了一行排序规则定义的代码，和索引搜索工具搜索时多了一个排序的参数而已。下面基于基本查询举例：

排序查询

6. 查询结果中关键字高亮显示

在查询过后展示给用户时，为了匹配醒目大多都会高亮关键字。
也是基于查询操作显示的，创建一个高亮工具，在结果处通过高亮工具显示指定结果。
高亮关键字结果显示

7.提高匹配得分（人为操作修改）

在搜索时我们经常会使用排序查询，按匹配得分排序。那有什么方法可以把得分提高吗？其实是有的，由于得分是由得分算法确定的如图：
得分算法公式
所以我们可以操作boost（激励因子）来提高得分，如下图：

好了小熙本次分享的基本Lucene使用笔记就到此结束了，下次还会分享进阶篇，Elasticsearch使用笔记分享。个人理解难免有些偏颇，如有误解，还请各位不吝赐教。
（本文仅供学习交流，如有转载请注明出处）

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Lucene使用详情笔记

1. 文档储存基本流程创建物理存储空间创建文档对象（参数是储存物理空间,也可以是多个文档的集合类，即为创建多个文档写入）向文档中添加字段创建索引写出器的配置对象（分词器版本号，分词器）创建索引写出器（第一个参数是配置对象，第二个参数是分词器）索引写出器把文档写入物理空间内（多个文档时是：indexWriter.addDocuments(document);）提交关流...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。