哈希分片之哈希取模法(round robin)

接着上一章数据路由分片抽象模型,本节介绍一种此抽象模型的实现方案-round robin(哈希取模法)

假设有K台物理机 根据以下方法就可以实现数据分片

H(key) = hash(key)mod K

物理机编号为0到K-1  根据以上哈希方法 可以把数据分配到每台机器上,取数据时也是使用相同的方法。


但是如果新增一台物理机,哈希函数就变成以下形式

H(key)=hash(key)mode(K+1)

之前存储好的数据和物理机之间的映射关系完全被打乱,所有数据需要重新分配,对于在线存储系统缺乏灵活扩展性。


对照上节的数据分片路由抽象模型可以看出,哈希取模法是把物理机和数据分片两个功能合二为一了,每台物理机对应一个数据分片,key-patition,partition-machine合为一体,用用一个hash函数来承担,这样就造成了,物理机和hash函数的严重耦合,故缺乏灵活扩展性




  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
要进行elasticsearch的分片查询,你可以使用以下方式: 1. 使用`GET /_cat/shards?v`命令来查看所有分片的情况。这个命令将列出每个节点包含的分片、每个分片的主/副信息、每个分片中的文档数以及这些文档在磁盘上占用的字节数。 2. 如果你只想查看某个索引的分片情况,可以使用`GET /_cat/shards/your_index_name?v`命令,其中`your_index_name`是你要查询的索引名称。 3. 主分片(Primary Shard)是elasticsearch的最小存储单元,一个index中的数据通常会存储在多个分片中。默认情况下,elasticsearch会为每个index分为5个主分片。复制分片(Replica Shard)主要用于数据冗余,以提高系统的可靠性。 4. 在elasticsearch中,分片的分配是在创建索引时就已经确定好的,并且无修改。分片数量的设置需要根据实际数据量和性能需求来决定。如果数据量较少,分片数量过多可能会降低效率。 5. 对于分片查询的具体过程,客户端会发送请求到任意一个节点,成为协调节点;协调节点会对文档进行路由,并将请求转发到对应的节点。在路由时,会使用round-robin随机轮询算,在主分片和其所有副本中随机选择一个节点进行负载均衡。然后,接收请求的节点会将文档返回给协调节点,最后协调节点再将结果返回给客户端。 6. 在写入文档时,每个文档都会自动分配一个全局唯一的id,也是根据id进行哈希路由到对应的主分片上。你也可以手动指定文档id,例如使用订单id或用户id。 7. 在读取文档时,你可以通过文档id进行查询,并根据id的哈希值判断该文档分配到了哪个分片上,然后从该分片中查询文档。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值