Region拆分策略

本文详细介绍了HBase中的Region概念,包括Region的组成部分、大小考量因素以及拆分策略。Region是HBase中分布式存储和负载均衡的最小单元,其拆分策略包括ConstantSizeRegionSplitPolicy、IncreasingToUpperBoundRegionSplitPolicy、DelimitedKeyPrefixRegionSplitPolicy和KeyPrefixRegionSplitPolicy。文章还讨论了如何自定义和配置拆分策略,以适应不同的业务需求。
摘要由CSDN通过智能技术生成

Region 概念

Region是表获取和分布的基本元素,由每个列族的一个Store组成。对象层级图如下:

 

Table      (HBase table)

   Region       (Regions for thetable)

        Store          (Store perColumnFamily for each Region for the table)

              MemStore        (MemStore for each Store for eachRegion for the table)

              StoreFile       (StoreFiles for each Store for eachRegion for the table)

                    Block     (Blocks within a StoreFile within a Storefor each Region for the table)

Region 大小

Region的大小是一个棘手的问题,需要考量如下几个因素。

 

Region是HBase中分布式存储和负载均衡的最小单元。不同Region分布到不同RegionServer上,但并不是存储的最小单元。

Region由一个或者多个Store组成,每个store保存一个columnsfamily,每个Strore又由一个memStore和0至多个StoreFile 组成。memStore存储在内存中, StoreFile存储在HDFS上。

HBase通过将region切分在许多机器上实现分布式。也就是说,你如果有16GB的数据,只分了2个region,你却有20台机器,有18台就浪费了。

region数目太多就会造成性能下降ÿ

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值