- 博客(7)
- 资源 (3)
- 收藏
- 关注
原创 Lucene Automaton(二)
在文章Automaton中我们介绍了确定型有穷自动机(Deterministic Finite Automaton)的概念,以及在TermRangeQuery中如何根据查询条件生成一个转移图,本文依旧根据该文章中的例子,介绍在Lucene中如何构建DFA,即生成图2的转移图,以及存储状态(state)、转移(transition)函数的数据结构。 我们再次给出文章Automaton中的例子:图1: 图1的第79行代码描述了TermRangQuery的查询范围为["bc","gch"],
2020-07-27 19:53:00 328
原创 Lucene 范围域 RangeField(一)
本文将介绍Lucene中提供的范围域(RangeField),以及基于该域实现的范围查询。范围域(RangeField) RangeField使得一个域有了空间的概念,并且最多支持到四维(4 dimensions):1 dimensions:该维度的域描述了一条直线上的一段长度,如果有如下的定义:图1: 用图形来描述这个域的话如下所示:图2:2 dimensions:该维度的域描述了平面上的一个矩形,如果有如下的定义:图3: 用图形来描述这个域的话如下所示:
2020-07-23 11:32:11 344
原创 Lucene 索引文件的读取(六)
本文接着介绍索引文件.dvd、.dvm之BinaryDocValues的读取,它同SortedValues一样,其中一个用途用于对查询结果的进行排序,在搜索阶段,当获取了满足查询条件的文档号之后,它会交给Collector实现收集功能,并且在收集过程中实现文档的排序,我们通过一个例子来介绍如何实现排序。看这里:https://www.amazingkoala.com.cn/Lucene/Search/2020/0715/155.html...
2020-07-15 16:51:19 251
原创 Lucene 索引文件的读取(五)
本篇文章开始介绍索引文件.dvm&&dvd的读取,阅读本系列文章建议先看下文章索引文件的生成(十八)之dvm&&dvd、索引文件的生成(十九)之dvm&&dvd、IndexedDISI(一)、IndexedDISI(二),了解写入的过程能快的理解读取的逻辑。 DocValues的其中一个用途用于对查询结果的进行排序,在搜索阶段,当获取了满足查询条件的文档号之后,它会交给Collector实现收集功能,并且在收集过程中实现文档的排序。本文先介绍在使用Sor
2020-07-15 16:50:20 269
原创 Lucene 软删除 softDeletes(六)
我们接着文章软删除softDeletes(五)继续介绍合并策略SoftDeletesRetentionMergePolicy,在文章近实时搜索NRT(一)中使用方法三&&方法四获取StandardDirectoryReader和文章文档提交之flush(八)终中执行流程点更新ReaderPool的流程图时,会判断一个段中的文档是否都被删除(软删除跟硬删除),如果为真,那么这个段对应的索引文件,也就是索引信息将从索引目录中物理删除(如果没有其他reader占用的话),但是如果使用了合并策略So
2020-07-09 18:43:48 196
原创 Lucene 软删除 softDeletes(五)
在文章软删除softDeletes(二)中介绍了软删除在索引(index)阶段的相关内容,我们接着介绍在flush/commit阶段的内容flush/commit 在这个阶段,我们首先要介绍的是DWPT在转化为一个段的期间,即下图中用红框标注的流程点,跟软删除相关的内容:图1:点击查看大图 上图中,流程点将DWPT中收集的索引信息生成一个段newSegment的介绍见文章文档提交之flush(三),注意的是,图1中的流程点基于版本为Lucene 7.5.0,但是软删除相关的处理时
2020-07-08 15:44:06 164
原创 Lucene 软删除 softDeletes(四)
在文章软删除softDeletes(二)中我们说到,在Lucene 7.5.0版本中,使用了下面两个容器来存储软删除的删除信息、DocValues的更新信息:Map<String,LinkedHashMap<Term,NumericDocValuesUpdate>> numericUpdates:DocValuesUpdatesNode Map<String,LinkedHashMap<Term,BinaryDocValuesUpdate>> bina
2020-07-08 15:43:04 145
Lucene DocValues介绍
2019-04-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人