Elasticsearch核心技术与实战学习笔记 39 | 文档分布式存储

最新推荐文章于 2024-04-19 18:45:01 发布

bohu83

最新推荐文章于 2024-04-19 18:45:01 发布

阅读量282

点赞数

分类专栏： ES 文章标签： elasticsearch 文档更新删除

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bohu83/article/details/106960807

版权

ES 专栏收录该内容

63 篇文章 17 订阅

订阅专栏

一序

本文属于极客时间Elasticsearch核心技术与实战学习笔记系列。

二文档储存在分片上

文档会存储在具体的某个主分片和副本分片上：例如文档 1，会储存在 P0 R0 分片上
文档到分片的映射算法

确保文档能均匀分布在所用分片上，充分利用硬件资源，避免部分机器空闲，部门机器繁忙
潜在的算法

随机 / Round Robin. 当查询文档 1，分片数很多，需要多次查询才能查档文档 1
维护文档到分片的映射关系，当文档数据量大的时候，维护成本高
实时计算，通过文档 1，自动算出，需要去哪个分片上获取文档.

这里ES采用的就是方案3

2.1 文档到分片的路由算法

shard = hash(_routing) % number_of_primary_shards

Hash 算法确保文档均匀分散到分片中
默认的_routing 值是文档 id
可以自行制定 routing 数值，例如用相同国家的商品，都分配到制定的 shard
设置 Index Setting 后，Primary 数，不能随意修改的根本原因

2.2 更新文档

顺序： index -> hash -> route -> delete -> index -> success -> response

1, 用户发出update请求，第一个节点是Coordinating Node，他通过hash计算算出文档对应分片，路由到这个分片。

更新是执行的两步，先删除再创建。成功后返回一个success给Coordinating Node，Coordinating Node再返回response

2.3删除一个文档

顺序：detele -> hash&route -> delete -> delete replica -> success -> deleted -> response

跟更新类似，多了删除副本的流程。

补充知识点：

可以设置 Index Settings ，控制数据的分片
Primary Shard 的值不能修改，修改需要重新 Index。
索引写入数据后，Replica 值可以修改。增加副本，可提高大并发下的读取性能
通过控制集群的节点数，设置 Primary Shard 数，实现水平扩展

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。