分布式文档储存————elasticsearch学习笔记（四）

最新推荐文章于 2024-10-24 23:41:23 发布

哇~是小菜呀

最新推荐文章于 2024-10-24 23:41:23 发布

阅读量2.1k

点赞数 1

分类专栏： elasticsearch 文章标签： elasticsearch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44712778/article/details/123901439

版权

elasticsearch 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

本文详细介绍了Elasticsearch（ES）的文档存储、更新和查询流程。每个文档至少存储在一个主分片中，可能有多个副本分片。通过hash算法，文档被均匀分布到分片中。新建或更新文档时，请求首先发送给主节点，再转发到对应分片执行。查询操作则通过轮询副本分片实现负载均衡。虽然存储成本增加，但ES的索引机制确保了高效的查询性能。

摘要由CSDN通过智能技术生成

路由一个文档到分片中

之前有提到一个文档至少被储存在一个主分片中，副本分片可以有多个，但是主分片至少有一个。
因此，例如一个集群被设置有3个主分片，为了保证文档被均匀的存储在这些主分片，es会根据routing（可能是文档的id或自己设置），通过一个hash算法将文档分配到一个主分片中进行储存。
这个过程有些像hashmap将一个键值对储存到底层的链表中的算法。
这样做的目的，就是让文档均匀地分布在分片中。
在这里插入图片描述

新建或删除文档

在这里插入图片描述

客户端向节点1发送新建、索引或删除文档的请求；
通过id计算文档属于分片P0，主节点向node3转发请求；
node3在主分片执行请求，如果请求成功，会将结果通知给副本分片所在的节点node1和node2；
一旦所有的副本分片都执行成功，会向主节点报告执行结果，主节点会向客户端报告执行结果。

取回单个文档

在这里插入图片描述

客户端向主节点node1发送请求；
结点使用文档的id知道文档所处的分片时分片P0，P0的副本分片R0处于节点2上，因此将请求转发给节点2；
node2将结果返回给主节点node1，node1将结果返回给客户端。

在处理读取请求时，主结点在每次请求的时候都会通过轮询所有的副本分片来达到负载均衡。也就是确定请求分配给“不忙”的结点。

局部更新文档

客户端向主节点发送强求；
主节点将请求转发到文档所在的节点；
node3从主节点接受到请求，尝试修改文档，如果此时有别的线程在修改文档，则继续尝试步骤三，超过 retry_on_conflict 次后放弃；
node3成功修改后，它将新版本的文档转发到node1和node2的副本节点上，重新建立索引，当所有的副本片区都完成文档更新，会告知主节点，主节点向客户端返回成功。

结论

从es储存、更新机制来看，文档的储存过程非常耗费时间和空间，如果在结构化数据库储存的数据只有一份，在es当中，则需要储存主分片和所有的副本分片，一次新增和修改都需要若干个节点参与。但是正因为每个数据的每个字段都被索引了，es的查询，分析效率非常高。

哇~是小菜呀

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。