lucene
文章平均质量分 95
破晓初
喜欢文本,喜欢搜索,喜欢你。
展开
-
Lucene TFIDFSimilarity评分公式详解
TFIDFSimilarity曾经是Lucene/Solr默认评分公式,想知道Lucene的评分过程就得先了解Lucene的评分公式,接下来将深刻剖析公式每个部分推导过程以及它的含义。原创 2017-02-26 17:34:41 · 3918 阅读 · 0 评论 -
Lucene Search流程之一
你知道搜索过程如何读取TermsDict,如何实现近似查询的吗?TermQuery与SpanQuery查询有什么不一样吗?先回顾倒排索引两大结构,讲述Lucene搜索流程中如何通过TermsDict获取到Postings所在的位置信息,以及每种方式是如何工作的且服务哪些查询类型。此外简述了读取不同的Postings信息,对应的查询类型。原创 2019-01-16 18:50:55 · 1568 阅读 · 0 评论 -
Lucene8.0新特征 DocValues改进
Lucene8.0新特征预告,继续优化DocValues,提升DocValues随机访问的性能。进一步讨论IndexedDISI的实现细节,以及如何服务DocValues。原创 2018-12-25 13:28:33 · 3564 阅读 · 4 评论 -
Lucene DocValues索引文件详解
解密DocValues索引的存储结构,为何正向索引能给搜索结果再处理带来更多可能性和不一样的体验。由哪里结构完成存储需求,相对FieldCache又有哪些优点?原创 2018-11-29 14:37:55 · 3589 阅读 · 2 评论 -
Lucene倒排索引简述 细说倒排索引构建
设计合适的数据结构对影响提升至关,在特定的场景使用的合适的结构是成功的基石,Lucene采用哪些数据结构解决构建索引的性能呢?本文将带你领略Lucene数据结构之美。原创 2018-11-13 23:39:42 · 10982 阅读 · 5 评论 -
Lucene倒排索引简述 番外篇
Lucene构建索引是一个非常复杂的过程,需要经过多道工序才能完成。那你知道Lucene在索引构建过程有哪些工序吗?又是整体流程是怎么样的呢?原创 2018-10-30 19:18:27 · 1520 阅读 · 4 评论 -
Lucene倒排索引简述 之倒排表
文章目录前言Postings编码VIntBlockPackedBlockPostings文件结构说明Frequencies And Skip Data(.doc文件)TermFreqs -- FrequenciesMulti-level SkipList -- SkipDataPostitions(.pos文件)Payloads and Offsets(.pay文件)总结前言上一篇《Lucen...原创 2018-10-09 20:31:55 · 7127 阅读 · 0 评论 -
Lucene倒排索引简述 之索引表
Lucene倒排索引的核心内容,索引表,你对这部分真的熟悉了吗?那你知道FST用什么地方吗?FST又存储了什么内容呢?有什么功能呢?关于Burst-Trie,你知道Lucene是如何采用它的思想来加速Lucene搜索性能的吗?原创 2018-09-27 09:57:42 · 4239 阅读 · 5 评论 -
Lucene's MergePolicy
Lucene’s MergePolicyLucene很多特征,在我看来跟LSM-Tree的数据库非常相似,甚至很多问题的解决方式都如出一辙。这里我想跟大家来聊聊Lucene的Segment合并问题,这个问题同样发生LSM-Tree数据库(HBase)。我们知道我们每次冲刷索引时,Lucene都会生成一个Segment。类似就是每个MemStore的冲刷势必会产生一个HFile的道理是一样一...原创 2018-03-23 16:58:33 · 1256 阅读 · 3 评论 -
Lucene DocValues详解
DocValues,人称正向索引,也是大家所认识的面向列存储。即通过文档编号与字段值在索引建立直接映射的关系,并存储。对DocValues我想你并不陌生,但我相信你对它并不算熟悉。接下来,我们将具体来看看它的存储结构、字段类型、以及使用场景等。原创 2017-03-07 00:10:39 · 10651 阅读 · 0 评论 -
Lucene Search流程之二
介绍Lucene的Search流程,从查询发起到文档的收集的所有步骤全在文中。从索引应用的角度进一步巩固Lucene索引构建流程,做到知其然也知其所以然。流程之外,还介绍了Lucene如果实现布尔检索模型,以及应用。原创 2019-02-28 20:28:06 · 1040 阅读 · 0 评论