1. 为什么要预分区
一张表被首次创建时,只会分配一个region给这个表。因此,在刚刚开始时,所有读写请求都会落在这个region所在的region server上,而不管你整个集群有多少个region server。不能充分地利用集群的分布式特性。
2. 最为常见的建表语句
create 'leo_test1',{NAME => 'info'}, { NUMREGIONS => 50, SPLITALGO => 'HexStringSplit'}
create 'leo_test2',{NAME => 'info'}, { NUMREGIONS => 50, SPLITALGO => 'DecimalStringSplit'}
create 'leo_test3',{NAME => 'info'}, { NUMREGIONS => 50, SPLITALGO => 'UniformSplit'}
各种Split算法适用场景:
-
HexStringSplit: rowkey是十六进制的字符串作为前缀的
-
DecimalStringSplit: rowkey是10进制数字字符串作为前缀的
-
UniformSplit: rowkey前缀完全随机