HRegionServer:集群节点,存储多个不同表的 region。
HRegion:是 hbase 中对表进行切割的单元,由 regionserver 负责管理。
HRegion 按大小分割的(默认 10G),每个表一开始只有一个 HRegion,随着数据不断插入 表, HRegion 不断增大,当增大到一个阀值的时候, HRegion 就会等分会两个新的 HRegion。 当表中的行不断增多,就会有越来越多的 HRegion。 HRegion 虽然是负载均衡的最小单元,但并不是物理存储的最小单元。 一个 HRegion 由多个 Store 组成,每个 Store 包含一个列族的所有数据。
Store:由一个位于内存的 Memstore 和位于硬盘的多个 StoreFile 组成。
StoreFile :保存实际数据的物理文件,数据在每个 StoreFile 中都是有序的。
MemStore:写缓存,由于 HFile 中的数据要求是有序的,所以数据是先存储在 MemStore 中,排好序后,等到达刷写时机才会刷写到 HFile,每次刷写都会形成一个新的 HFile。
HLog(WAL):预写日志系统用来做灾难恢复之用,HLog 记录数据的所有变更,一旦数据修 改,就可以从 Log 中进行恢复。 每个 RegionServer 维护一个 HLog,而不是每个 Region 一个。