Hegion描述
- HBase中的一个表,刚创建时,只有一个HRegion,随着数据量递增,达到阈值20G时,等分成两个HRegion,分布在不同的HRegionServer结点上。
- 阈值由属性hbase.hregion.max.filesize指定,默认10G
- 一个HRegion由N个Store(HStore,N>=1)构成
- 一个Store对应一个列族,有一个MemoryStore和多个StoreFile组成
- MemStore是一个写缓存(In Memory Sorted Buffer),所有数据在写完WAL日志后,会写入MemStore中。
- MemStore数据达到阈值,由MemStore根据一定的算法(LSM-TREE算法,这个算法的作用是将数据顺序写入磁盘,而不是随机写,减少磁头调度时间,从而提高写入性能)将数据Flush到底层的HDFS文件中(HFile)。
- HFile(StoreFile) 用于存储HBase的数据(Cell/KeyValue)。在HFile中的数据是按RowKey、Column Family、Column排序,对于相同的Cell(即这三个值都一样),则按timestamp倒序排列(即最新的数据在最前面)
HEGION寻址
- 客户端⾸先会根据配置⽂件中zookeeper地址连接zookeeper,并读取/hbase/meta-region-server节点信息,该节点信息存储HBase元数据(hbase:meta)表所在的RegionServer地址以及访问端⼝等信息。⽤户可以通过zookeeper命令(get /hbase/meta-region-server)查看该节点信息,信息为hbase:meta元数据表的存放HRegionServer地址
- 根据hbase:meta所在Region的访问信息,客户端会将该元数据表加载到本地并进⾏缓存。然后在表中确定待检索rowkey所在的Region信息
- 根据数据所在RegionServer的访问信息,客户端会向该HRegionServer发送真正的数据读取请求