第一、数据分区存储(region)
通过rowkey可以快速地位到在那个region上,位置信息保存在hbase的meta表里。
每次查询都会有location cache的,所以htable里面的Hconnection 初始化的时候访问速度相对来说稍慢,客户端缓存截图如下。
随着数据越来越大,meta表的查询有可能遇到瓶颈,建议单独独立出成一个meta server。
(备注:一个meta表的一条记录大概为1k)。
第二、hbase的数据格式 HFile V2 (HFile V1代码已经出hbase版本删除了)