hbase的预分配region

最新推荐文章于 2022-11-22 18:53:16 发布

记录点滴人生

最新推荐文章于 2022-11-22 18:53:16 发布

阅读量1.5k

点赞数

分类专栏： hbase

hbase 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

在create一个表时如果不指定预分配region，则默认会先分配一个region，这样在大数据并行载入时性能比较低，因为所有的数据都往一个region灌入，容易引起单节点负载升高，从而影响入库性能，一个好的方法时在建立表时预先分配数个region。方法有两种，主要针对不同版本可供选择。

1.使用RegionSplitter方法，主要针对hbase-0.90.X版本

a.首先使用RegionSplitter建表，预分配region，例如建立一个poidb表，列簇为info，预分配9个region，

hbase org.apache.hadoop.hbase.util.RegionSplitter -c 9 -f info poidb

b.修改建表参数（可选）

默认建表是没有开启Bloomfilter和压缩参数的，这里为了提供读性能，建议开启Bloomfilter，同时使用压缩SNAPPY，进入hbase shell，首先需要disable 'poidb',然后使用使用

alter 'poidb',{NAME => 'info',BLOOMFILTER => 'ROWCOL',COMPRESSION => 'SNAPPY',VERSIONS => '1'}

最后enable 'poidb'

2.使用hbase shell建表参数，真多0.94.x版本

0.94版本可以直接在建表时直接使用预分配regions：

create 'poidb', { NAME => 'info', COMPRESSION => 'snappy',VERSIONS => '1' }, {NUMREGIONS => 9, SPLITALGO => 'HexStringSplit'}

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。