Es
文章平均质量分 90
Mr小林
软件工程师的成才之路。
展开
-
Elasticsearch 如何做到快速检索 - 倒排索引的秘密
本文不会关注 ES 里面的分布式技术、相关 API 的使用,而是专注分享下“ES 如何快速检索”这个主题上面。这个也是我在学习之前对 ES 最感兴趣的部分。 本文大致包括以下内容: 关于搜索: 传统关系型数据库和 ES 的差别 搜索引擎原理 细究倒排索引: 倒排索引具体是个什么样子的(posting list→term dic→term index) 关于 postings list 的一些巧技(FOR、Roaring Bitmaps)转载 2021-11-12 10:06:01 · 129 阅读 · 0 评论 -
Elasticsearch
什么是 Elasticsearch?它是一个分布式的开源搜索和分析引擎,适用于所有类型的数据,包括文本、数字、地理空间、结构化和非结构化数据。 无论在开源还是专有领域,Lucene可以被认为是迄今为止最先进、性能最好的、功能最全的搜索引擎库。但是,Lucene非常复杂,使用之前需要深入了解检索的相关知识来理解它是如何工作的。Elasticsearch(以下用ES代替)是一个基于Lucene的分布式可扩展的实时分析搜索引擎。它的目的是通过简单的RESTfulAPI来隐藏Lucene的复杂性,从而让全文搜索变转载 2020-08-13 09:53:56 · 219 阅读 · 0 评论 -
ES 在数据量很大的情况下如何提高查询效率
如果面试的时候碰到这样一个面试题:ES 在数据量很大的情况下(数十亿级别)如何提高查询效率? 这个问题说白了,就是看你有没有实际用过 ES,因为啥?其实 ES 性能并没有你想象中那么好的。 很多时候数据量大了,特别是有几亿条数据的时候,可能你会懵逼的发现,跑个搜索怎么一下 5~10s,坑爹了。 第一次搜索的时候,是 5~10s,后面反而就快了,可能就几百毫秒。 你就很懵,每个用户第一...转载 2020-03-10 17:54:29 · 952 阅读 · 2 评论