hbase读取数据流程

一,读取流程

  • 1,客户端首先从zookeeper获取元数据所在的region server
  • 2,客户端获取元数据,根据用户条件确定数据所在server、region,并发向这些server请求数据
  • 3,server构建三层扫描器,从region、store、hfile三个层面进行过滤
  • 4,首先根据rowkey定位到region
  • 5,定位到region后,接下来定位数据所在的hfile:根据rowkey结合rowkey、timestamp、布隆过滤器,过滤没有要查询的数据的hfile
  • 6,在hfile中定位到block:hfile中存储着block的索引,索引是map结构,key称之为blockkey,值为block中第一个rowkey。可以根据blockkey初步判断当前block是否存在要查找的数据
  • 7,定位到block之后,从BlockCache中查询是否有block缓存,有则从缓存读取;
  • 8,若无block缓存,需要从hdfs中读取;
    在这里插入图片描述

二,索引思考

1,hbase为了快速读取,有什么索引机制?

首先,在元数据中,有region server存储的rowkey范围,可以快速的查找到region sever,准确的说是定位到具体的region

其次,region有多个store构成,store有多个hfile构成,数据存储以block为单位。第一步,根据每个hfile的rowkey和timestamp以及布隆过滤器过滤掉不需要的hfile,再根据每个hfile维护的block索引结合rowkey定位到block块。

这就是hbase的索引机制。当然,为了提高读取效率,还有很多其他的措施,比如blcokcache、memory store。

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Java追光着

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值