Elasticsearch document数据路由原理

最新推荐文章于 2021-01-04 09:53:35 发布

82年的哇哈哈

最新推荐文章于 2021-01-04 09:53:35 发布

阅读量110

点赞数

分类专栏： elasticsearch高级进阶

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42201566/article/details/112031538

版权

elasticsearch高级进阶专栏收录该内容

23 篇文章 1 订阅

订阅专栏

（1）什么是document数据路由

一个index的数据会被分为多个分片，每个分片都在一个shard中，所以说一个document只能存在一个shard中

当客户端创建document的时候 es此时就需要判断这个document放在哪个shard上这个过程称之为document routing 数据路由

（2）路由算法：shard = hash(routing) % number_of_primary_shards

举个例子，一个index有3个primary shard，P0，P1，P2

每次增删改查一个document的时候，都会带过来一个routing number，默认就是这个document的_id（可能是手动指定，也可能是自动生成）
routing = _id，假设_id=1

会将这个routing值，传入一个hash函数中，产出一个routing值的hash值，hash(routing) = 21
然后将hash函数产出的值对这个index的primary shard的数量求余数，21 % 3 = 0
就决定了，这个document就放在P0上。

决定一个document在哪个shard上，最重要的一个值就是routing值，默认是_id，也可以手动指定，相同的routing值，每次过来，从hash函数中，产出的hash值一定是相同的

无论hash值是几，无论是什么数字，对number_of_primary_shards求余数，结果一定是在0~number_of_primary_shards-1之间这个范围内的。0,1,2。

（3）routing的值可以手动指定

默认的routing就是_id
也可以在发送请求的时候，手动指定一个routing value，比如说put /index/type/id?routing=user_id

手动指定routing value是很有用的，可以保证说，某一类document一定被路由到一个shard上去，那么在后续进行应用级别的负载均衡，以及提升批量读取的性能的时候，是很有帮助的

（4）primary shard数量为什么不可变

例如：现在primary shard个数是3 所有的doucument放在哪个shard是对3取余数得到的如果现在primary shard修改为4 那么在获取数据时候使用get 将是对4取余将找不到原来的document

82年的哇哈哈

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Elasticsearch document数据路由原理

（1）什么是document数据路由一个index的数据会被分为多个分片，每个分片都在一个shard中，所以说一个document只能存在一个shard中当客户端创建document的时候 es此时就需要判断这个document放在哪个shard上这个过程称之为document routing 数据路由（2）路由算法：shard = hash(routing) % number_of_primary_shards举个例子，一个index有3个primary shard，P0，P1，P2
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。