http://hi.baidu.com/xuelianglv/blog/item/bdff9a1ecc15201940341725.html
一个Region在HBase中用一个HRegionInfo表示。该类定义在文件HRegionInfo.java中。一个Region包括如下几个重要属性:
// 代表Region的开始Key
byte [] startKey = HConstants.EMPTY_BYTE_ARRAY;
// 代表Region的结束Key
byte [] endKey = HConstants.EMPTY_BYTE_ARRAY;
// 该Region的id
long regionId = -1;
// 该Region的名字
byte [] regionName = HConstants.EMPTY_BYTE_ARRAY;
// 所在Table的表描述符
HTableDescriptor tableDesc = null;
开始Key和结束Key对应该Region中包含了哪些Row。RegionId用于唯一的标识该Region。
1. Region名字的组成:table的名字,开始Key,RegionId。函数
createRegionName(byte[] tableName, byte[] startKey, byte[] id) 用于生产region名字。
由于Region的名字中包含了table的名字,HRegionInfo提供了一个getTableNameFromRegionName
用于从Region名字中返回table名字。
2. 为便于Logging,HRegionInfo类包含了字段regionNameStr,返回用于logging的Region name字符串。
3. 该Region是否是Root Region?
tableDesc.isRootRegion() 为true表明该Region是Root Region。
4. 该Region是否是MetaRegion?
tableDesc.isMetaRegion()为true表明该Region是Meta region。
HRegionInfo其它的字段:
split:表明该region是否已经split了,并且包含daughters。
offLine: 表明该region是否是offline的
HRegionInfo提供了一个函数encodeRegionName,对Region名字进行编码,在很多地方使用了这个编码
结果。编码采用了JenkinsHash,见http://burtleburtle.net/bob/hash/doobs.html
int encodeRegionName的实现(byte[] regionName):
Math.abs(JenkinsHash.hash(regionName, regionName.length, 0))