1、认识加盐
Phoenix中加盐是指对:Phoenix中PK(主键)对应的byte数组插入特定的byte数据。
2、加盐能解决什么问题
加盐能解决HBASE读写热点问题,例如:单调递增rowkey数据的持续写入,使得负载集中在某一个RegionServer上引起的热点问题。通过加盐,将数据打散分布在不同的RegionServer上,降低RegionServer的压力。
3、如何加盐
创建表的时候指定属性值:SALT_BUCKETS,其值表示所分buckets(region)数量, 范围是1~256
注意:SALT_BUCKETS一旦指定就不能修改了, 这对设计表时要着重考虑一下
CREATE TABLE IF NOT EXISTS test_user (
id VARCHAR NOT NULL PRIMARY KEY,
username VARCHAR ,
phoen VARCHAR ,
addr VARCHAR,
times bigint) SALT_BUCKETS = 4;
4、原理是什么
加盐是在原来key的基础上增加一个byte作为前缀,计算公式如下
new_row_key = ((byte) (hash(original_key) % BUCKETS_NUMBER) + original_key
BUCKETS_NUMBER 指创建表时指定的 SALT_BUCKETS 大小
5、加盐表的注意事项
1)创建加盐表时不能再指定split key
2)一个bucket可以对应多个region
3)太大的slated buckets会减小range查询的灵活性,甚至降低查询性能
4)当可用block cache的大小>表数据大小时,slated buckett和region server数量相同,这样可以得到更好的读写性能。 但当表的数量很大时,基本上会忽略blcok cache的优化收益,大部分数据仍然需要走磁盘IO。比如对于10个region server集群的大表,可以考虑设计64~128个slat buckets。