HDFS RBF支持多目标集群的挂载映射

前言


在RBF出现之前的ViewFS还是现在发布的RBF,目前支持的映射模式都是1对1的。什么意思呢?就是一个虚拟路径地址对一个实际集群地址。这种方式会有个弊端,如果写入的数据量很大,那么这个集群会出现容量用完的情况。针对这种潜在的“大路径”,其实我们可以希望他的目标集群地址可以有多个。这样就可以减轻单一集群的高负载现象了。但是如果支持配置多个地址,那么地址的选择策略将是一个很重要的环节了。因为数据写出去了,你还必须要保证能把这个地址重新找到吧。笔者今天就来聊聊这个有意思的话题,目前在社区中正在实现。

多目标集群支持的目标


简单来说,RBF写出支持多目标集群写出就是为了解决一个负载均衡的问题。这样会使得RBF使用起来更具扩展性。

但是在前言中同样提到,这里的难题实质上就变成了目标集群地址的选择策略问题。一种自然联想到的最简单的策略就是随机选择。哪怎么逆向找到这个写出位置呢?每个集群都尝试执行一次RPC请求,因为没有地方保存最好的真实映射关系。Mount table信息仅仅提供虚拟路径对多个地址的映射,仅到这个层面。当然这只是一种最简单不过的策略实现,其实RBF在实现这块逻辑的时候,还是考虑了不同的策略算法的。我们继续往下看。

目标集群选择策略


这块内容就是上节提到的目标集群的选择策略部分了。如果一个虚拟路径映射到多个集群路径地址时,当前支持哪几种策略呢?答案有以下5类:

  • 随机选择策略。
  • 本地优先策略。
  • 完全哈希策略。
  • 局部哈希策略。
  • 基于可用空间的策略(待实现)

下面笔者逐一来解释。

第一种,随机选择策略

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值