HBase预分区
创建HBase时默认一张表只有一个region,所有put操作都会往这个region中填充数据,当这个region过大就会进行split。
在创建表的时候就进行预分区,就可以减少当数据猛增时由于region split带来的资源消耗
HBase表的预分区需要紧密结合业务场景选择区分key值,每个region都有一个startkey和endkey表示该region存储rowKey范围
create 't10','cf',SPLITS=>['10','20','30']
或
create 't2', 'cf', SPLITS_FILE => '/home/hadoop/splitfile.txt' /home/hadoop/splitfile.txt中存储内容如下:
20150501000000000
20150515000000000
20150601000000000
会创建4个region,可在hbase的Web UI界面查看
hdfs中也可以查到对应分区存储文件位置