ES索引原理（3）（*）

Firm陈

已于 2022-08-14 16:28:10 修改

阅读量625

点赞数 1

分类专栏：消息中间件文章标签： elasticsearch 数据库 big data

于 2021-10-17 15:24:13 首次发布

本文链接：https://blog.csdn.net/weixin_42408447/article/details/120811121

版权

本文详细介绍了Elasticsearch的索引原理，包括其作为分布式搜索引擎的角色，以及如何利用倒排索引、Term Dictionary、Term Index、FST等技术实现高效的搜索性能。文章还探讨了压缩技巧如Frame Of Reference和Roaring bitmaps，以及联合索引的实现方式，强调了正确设置字段索引的重要性。

摘要由CSDN通过智能技术生成

介绍
Elasticsearch 是一个分布式可扩展的实时搜索和分析引擎.
Elasticsearch 是一个建立在全文搜索引擎 Apache Lucene™ 基础上的搜索引擎. 当然 Elasticsearch 并不仅仅是 Lucene 那么简单，它不仅包括了全文搜索功能，还可以进行以下工作:
（1）分布式实时文件存储，并将每一个字段都编入索引，使其可以被搜索。
（2）实时分析的分布式搜索引擎。
（3）可以扩展到上百台服务器，处理PB级别的结构化或非结构化数据。

基本概念
先说Elasticsearch的文件存储，Elasticsearch是面向文档型数据库，一条数据在这里就是一个文档，用JSON作为文档序列化的格式，比如下面这条用户数据：

{
   
    "name" :     "John",
    "sex" :      "Male",
    "age" :      25,
    "birthDate": "1990/05/01",
    "about" :    "I love to go rock climbing",
    "interests": [ "sports", "music" ]
}