ElasticSearch底层原理解析

最新推荐文章于 2024-10-13 21:07:57 发布

Lill_bin

最新推荐文章于 2024-10-13 21:07:57 发布

阅读量801

点赞数 3

分类专栏：杂谈文章标签： elasticsearch 大数据搜索引擎分布式 zookeeper 云原生 jenkins

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_56438516/article/details/142148073

版权

杂谈专栏收录该内容

32 篇文章 0 订阅

订阅专栏

Elasticsearch（简称ES）是一个基于Lucene的开源、分布式、RESTful搜索引擎。它具备全文检索、结构化搜索、数据分析、复杂语言处理、地理位置处理以及对象关联分析等功能。ES的设计允许水平扩展，支持PB级别的数据，并且提供了近实时的搜索能力。

架构原理

ES的架构包括以下几个核心概念：

节点（Node）：ES集群中的一个实例。
集群（Cluster）：由多个节点组成，共同工作，共享数据，提供高可用性。
索引（Index）：存储文档的集合，类似于数据库中的数据库。
分片（Shard）：索引可以被分成多个分片，分片可以分布在集群的不同节点上，支持数据的水平扩展。
副本（Replica）：每个分片可以有多个副本，提高数据的可用性和容错性。

写入数据流程

当数据写入ES时，会经过以下步骤：

客户端发送数据到任意节点，该节点成为协调节点（Coordinator Node）。
协调节点根据文档ID的哈希值，确定数据应该路由到哪个主分片。
主分片接收数据，并在内存中进行索引构建，同时将数据写入事务日志（Translog）以保证数据不丢失。
数据被刷新（Refresh）到磁盘上的Lucene索引段（Segment）中，此时数据可以被搜索到。
通过段合并（Segment Merging）优化存储和搜索性能。

检索数据流程

检索数据时，流程如下：

客户端发送搜索请求到任意节点，该节点成为协调节点。
协调节点将查询请求分发到所有相关的分片。
每个分片并行处理查询，并返回结果给协调节点。
协调节点聚合结果，并进行排序、分页等操作。
协调节点返回最终结果给客户端。

优势

高可用性：通过分片和副本机制，即使部分节点故障，服务也不会中断。
水平扩展：可以简单地添加更多节点来扩展存储和处理能力。
高性能：并行处理查询请求，提高查询性能。
容错性：副本机制确保数据的持久性和一致性。

总结

Elasticsearch通过其分布式架构，提供了一个强大、灵活且可扩展的搜索解决方案。它的设计哲学是简单性和易用性，同时隐藏了底层Lucene的复杂性。通过分片和副本机制，ES能够处理大规模数据集，并提供快速、准确的搜索结果。

关注

3
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

博客等级

码龄4年

203
原创

3101
点赞

2302
收藏

2242
粉丝

关注

私信

热门文章

分类专栏

java 97篇
杂谈 32篇
JAVA面试题 59篇
前端 3篇
测试工具 1篇
MySQL 3篇
leetcode 6篇
python 1篇

最新评论

深入理解ElasticSearch集群：架构、高可用性与数据一致性
普通网友: 文章内容通俗易懂，适合不同层次的读者。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
TCP/IP协议栈详解及其在现代网络中的应用
Lill_bin: Thank you
TCP/IP协议栈详解及其在现代网络中的应用
征途黯然.: I'm impressed by this article about TCPIP协议栈详解及其在现代网络中的应用, and it has given me a clearer understanding.
ZooKeeper 中的 Curator 框架解析
普通网友: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，文章思路清晰【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
分库分表：应对大数据量挑战的数据库扩展策略
普通网友: 优质好文，支持支持。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。