Hbase的读写流程

一、HBase读数据流程

Hbase的regionserver里面有内存Memstoreblock cache
Memstore作业主要是写,另一部分主要是读的。
block cache用的是LRU,如果block cache达到上限,会启动淘汰机制。

(1)HRegionServer保存着.META.的这样一张表以及表数据,要访问表数据,首先Client先去访问zookeeper,从zookeeper里面找到.META.表所在的位置信息,即找到这个.META.表在哪个HRegionServer上保存着。

(2)接着Client通过刚才获取到的HRegionServer的IP来访问.META.表所在的HRegionServer,从而读取到.META.,进而获取到.META.表中存放的元数据。

(3)Client通过元数据中存储的信息,访问对应的HRegionServer,然后扫描(scan)所在HRegionServer的Memstore如果没有,扫描block cache(读数据的缓存),如果还没有去Storefile来查询数据,查到数据之后将数据读到block cache。

(4)最后HRegionServer把查询到的数据响应给Client。

流程图:
在这里插入图片描述

二、HBase写数据流程

(1)Client也是先访问zookeeper,进而找到.META.表,并获取.META.表信息。

(2)确定当前将要写入的数据所对应的RegionServer服务器和Region。

(3)Client向该RegionServer服务器发起写入数据请求,然后RegionServer收到请求并响应。

(4)Client先把数据写入到HLog,以防止数据丢失。

(5)然后将数据写入到Memstore。

(6)如果Hlog和Memstore均写入成功,则这条数据写入成功。在此过程中,如果Memstore达到阈值,会把Memstore中的数据flush到StoreFile中。

(7)当Storefile越来越多,会触发Compact合并操作,把过多的Storefile合并成一个大的Storefile。当Storefile越来越大,Region也会越来越大,达到阈值后,会触发Split操作,将Region一分为二。

提示:因为内存空间是有限的,所以说溢写过程必定伴随着大量的小文件产生。

流程图:
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值