ElasticSearch17:图解剖析document路由原理

1.document路由到shard上,是什么意思?

我们知道,一个index的数据会分成多片,
每片都在一个shard中,所以,一个document
只能存在于一个shard中。

当客户端创建document的时候,es此时就需要决定,
这个document是放在这个index的哪个个shard中。

这个过程称之为document routing,数据路由




2.路由算法

shard = hash(routing) % number_of_primary_shard

例如:一个index有3个 primary shard,p0,p1,p2

每次增删改查一个document的时候,都会带过来一个routing number,默认就是这document的_id(可能是手动指定,也可能是自动生成)

routing = _id

会将这个routing值,传入一个hash函数中,产出一个routng值的hash值,比如:hash(routing)的结果=21

然后将hash函数产出的结果对这个index的primary shard的数量的余数,21%3 = 0

这样,就决定将document路由到p0上。


总结:

决定一个document在哪个shard上,最重要的一个值就是routing值,默认是_id,也可以手动指定。相同的routing值,每次传递过来,hash后的值都是一样的。

无论哪个document,hash值取余number_of_primary_shard的结果范围在0~(number_of_primary_shard-1)。


3._id or custom routing value

默认的routing值是_id.

也可以在发送请求的时候,手动指定一个routing value。比如说 put /index/type/id?routing=user_id

手动指定routing是很有用的,可以保证说,某一类document一定路由到一个shard上去,那么在后需进行应用级别的负载均衡,以及提升批量读取的性能的时候,是很有帮助的。


4.primary shard数量不可变的秘密

primary shard一旦建立,不能修改。而replica shard的数量则是可以修改的。
这是因为路由算法和replica shard无关





评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值