HBase读写机制和物理模型

本文详细介绍了HBase的写入、读取机制以及数据删除与合并的过程。在写操作中,数据先写入write ahead log(WAL)和MemStore,MemStore满后形成HFile。读操作利用BlockCache提高性能,BlockCache是基于LRU的缓存,用于保存频繁访问的数据。数据删除时仅标记,直至大合并时才实际释放空间。物理模型上,每个列族有自己的HFile集合,一行的所有数据在Region中管理,列族数据物理上存放在一起。
摘要由CSDN通过智能技术生成

写机制

执行写入时会写到两个地方:write ahead logMemStore,保证数据的持久化。

MemStore是内存中的写入缓冲区,数据在永久写入硬盘前在此积累,当其填满时(可以由hbase.hregion.memstore.flush.size定义),数据会被刷写到硬盘,生成一个HFile。
在集群的每一个节点上,每个列族都有一个MemStore

由于MemStore是在内存中的,具有易失性,所以还需要WAL。
每台服务器维护一个WAL来记录发生的变化。如果服务器宕机,没有从MemStore刷写到硬盘的数据可以通过回放WAL来恢复

读机制

类似于MemStore,HBase在读的时候也维护一个内存的缓存区,基于LRU算法的BlockCache,用来保存从HFile里读入内存的频繁访问的数据。它和MemStore在同一个JVM堆里,所以类似的,每个列族都有一个BlockCache

Block是HBase从硬盘完成一次读取的数据单位,类似于操作系统中文件系统的block。
HFile的物理存放模式是:一个Block的序列 + 这些block的索引。所以,从HFile读取一个Block时需要先在索引上查找一次该block然后从硬盘读出。

block大小是可设置的。

  • 对于主要用于随机访问,可采用细粒度的block,这样索引表变大,但是数据传输量变小。
  • 对于主要用于顺序扫描&#
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值