《HBase权威指南》读书笔记 第八章:架构:读取数据、region生命周期、ZK数据结构

本文是《HBase权威指南》第八章的读书笔记,主要探讨了HBase的读取数据机制,包括如何通过时间戳和布隆过滤器快速定位数据;region的生命周期,详细介绍了region的各种状态;以及ZooKeeper在HBase中的作用,如存储集群、主节点、副本、region等关键信息。
摘要由CSDN通过智能技术生成

读取数据

读取数据的难点在于,有可能一行数据储存在多个文件中,也有可能在memstore中。例如,同一个row key在不同的时间写入不同列的数据,那么取这个row key所有列的时候就需要扫描多个文件。

get操作从实现上来说,和scan操作是一样的。

get或者scan操作内部实现机制步骤如下:

  1. 根据时间戳、布隆过滤器快速排除一些文件,这些文件中绝不可能包含需要取的KeyValue。
  2. 从最新的store file开始扫描,每个文件只扫描需要的block,根据行键进行扫描

region的生命周期

region的生命周期总共有如下几种状态:

  • offline:下线状态
  • pending open:打开region的请求已经发送到了服务器
  • opening:服务器开始打开region
  • open:region已经打开,并且可以使用了
  • pending close:关闭region的请求已经发送到了服务器
  • closing:服务器开始关闭region
  • closed:服务器已关闭region
  • splitting:正在切分region
  • splitted:region切分完成

Zookeeper

zk中包含以下重要信息:

  • /hbase/hbaseid:集群编号
  • /hbase/master:主节点的编号
  • /hbase/repli
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值