HBase建表函数提供了四个重载函数,分别是
- void createTable(HTableDescriptor desc)
- void createTable(HTableDescriptor desc, byte[] startKey,byte[] endKey, int numRegions)
- void createTable(HTableDescriptor desc, byte[][] splitKeys)
- void createTableAsync(HTableDescriptor desc, byte[][] splitKeys)
第一个函数相对简单,就是创建一个表,这个表没有任何region。后三个函数是创建表的时候帮你分配好指定数量的region(提前分配region的好处,了解HBase的人都清楚,为了减少Split,这样能节省不少时间)
第二个函数是使用者指定表的“起始行键”、“末尾行键”和region的数量,这样系统自动给你划分region。根据的region数,来均分所有的行键。这个方法的问题是如果你的表的行键不是连续的,那样的话就导致有些region的行键不会用到,有些region是全满的。
所以HBase很人性的给了第三种和第四种方法。这两个函数是用户需要自己region的划分。这个函数的参数splitKeys是一个二维字节数据,行的最大数表示region划分数+1,列就表示region和region之间的行键。比如:
- byte[][] regions = new byte[][] {
- Bytes.toBytes("A"),
- Bytes.toBytes("D"),
- Bytes.toBytes("G"),
- Bytes.toBytes("K"),
- Bytes.toBytes("O"),
- Bytes.toBytes("T")
- };
- [1] start key: , end key: A
- [2] start key: A, end key: D
- [3] start key: D, end key: G
- [4] start key: G, end key: K
- [5] start key: K, end key: O
- [6] start key: O, end key: T
- [7] start key: T, end key: