HBase学习笔记——物理模型

版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq280929090/article/details/56302851

一、HRegion

  1. HBase中表在行的方向上分割为多个Hregion。
    这里写图片描述

  2. HRegion按大小分割的,每个表一开始只有一个region,随着数据不断插入表,HRegion不断增大,当增大到一个阀值的时候,HRegion就会等分会两个新的HRegion,当table中的行不断增多,就会有越来越多的Hregion。
    这里写图片描述

  3. HRegion是HBase中分布式存储和负载均衡的最小单元。最小单元就表示不同的HRegion可以分布在不同的HRegion Server上,但一个HRegion是不会拆分到多个server上的。
    这里写图片描述

  4. HRegion虽然是分布式存储的最小单元,但并不是存储的最小单元。事实上,HRegion由一个或者多个Store组成,每个store保存一个columns family。每个Strore又由一个memStore和0至多个StoreFile组成。
    这里写图片描述

二、HFile

StoreFile以HFile格式保存在HDFS上。HFile的格式为:
这里写图片描述

HFile分为六个部分:

  1. Data Block段:保存表中的数据,这部分可以被压缩。
  2. Meta Block段(可选的):保存用户自定义的键值对,可以被压缩。
  3. File Info段:Hfile的元信息,不被压缩,用户也可以在这一部分添加自己的元信息。
  4. Data Block Index段:Data Block的索引,每条索引的key是被索引的Block的第一条记录的key。采用LRU机制淘汰。
  5. Meta Block Index段(可选的):Meta Block的索引。
  6. Trailer段:这一段是定长的,保存了每一 段的偏移量。

读取一个HFile时,会首先读取Trailer,Trailer保存了每个段的起始位置(段的Magic Number用来做安全检查);然后,Data Block Index会被读取到内存中,这样,当检索某个key时,不需要扫描整个HFile,而只需从内存中找到Key所在的Block,通过一次磁盘io将整个 Block读取到内存中,再找到所需要的key。

HFile的Data Block,Meta Block通常采用压缩方式存储,压缩之后可以大大减少网络IO和磁盘IO,相应的需要花费CPU进行压缩和解压缩。

目前HFile的压缩支持两种方式:Gzip、Lzo。

三、HLog(WAL log)

分布式系统环境中,无法避免系统出错或者宕机,因此一旦HRegionServer 意外退出,MemStore 中的内存数据将会丢失,这就需要引入HLog 了。

WAL 意为Write ahead log,类似mysql中的binlog,用来做灾难恢复,Hlog记录数据的所有变更,一旦数据修改,就可以从log中进行恢复。

每个Region Server维护一个Hlog,而不是每个Region一个。这样不同Region(来自不同表)的日志会混在一起,这样做的目的是不断追加单个文件相对于同时写多个文件而言,可以减少磁盘寻址次数,因此可以提高对表的写性能。带来的麻烦是,如果一台Region Server下线,为了恢复其上的Region,需要将Region Server上的log进行拆分,然后分发到其它Region Server上进行恢复。

HLog 文件定期会滚动出新的,并删除旧的文件(已持久化到StoreFile 中的数据)。当HRegionServer 意外终止后,HMaster 会通过Zookeeper 感知到,HMaster 首先会处理遗留的HLog 文件,将其中不同Region 的Log 数据进行拆分,分别放到相应region 的目录下,然后再将失效的region 重新分配,领取到这些region 的HRegionServer 在Load Region 的过程中,会发现有历史HLog 需要处理,因此会Replay HLog 中的数据到MemStore 中,然后flush 到StoreFiles,完成数据恢复。

HLog文件就是一个普通的Hadoop Sequence File,Sequence File 的Key是HLogKey对象,HLogKey中记录了写入数据的归属信息,除了table和region名字外,同时还包括 sequence number和timestamp,timestamp是”写入时间”,sequence number的起始值为0,或者是最近一次存入文件系统中sequence number。HLog Sequece File的Value是HBase的KeyValue对象,即对应HFile中的KeyValue,可参见上文描述。

展开阅读全文

没有更多推荐了,返回首页