HBase读写机制和物理模型

最新推荐文章于 2021-04-08 20:16:36 发布

amghost

最新推荐文章于 2021-04-08 20:16:36 发布

阅读量1.3k

点赞数

分类专栏： hbase 文章标签： hbase

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/amghost/article/details/45390031

版权

本文详细介绍了HBase的写入、读取机制以及数据删除与合并的过程。在写操作中，数据先写入write ahead log（WAL）和MemStore，MemStore满后形成HFile。读操作利用BlockCache提高性能，BlockCache是基于LRU的缓存，用于保存频繁访问的数据。数据删除时仅标记，直至大合并时才实际释放空间。物理模型上，每个列族有自己的HFile集合，一行的所有数据在Region中管理，列族数据物理上存放在一起。

摘要由CSDN通过智能技术生成

写机制

执行写入时会写到两个地方：write ahead log 和 MemStore，保证数据的持久化。

MemStore是内存中的写入缓冲区，数据在永久写入硬盘前在此积累，当其填满时（可以由hbase.hregion.memstore.flush.size定义），数据会被刷写到硬盘，生成一个HFile。
在集群的每一个节点上，每个列族都有一个MemStore

由于MemStore是在内存中的，具有易失性，所以还需要WAL。
每台服务器维护一个WAL来记录发生的变化。如果服务器宕机，没有从MemStore刷写到硬盘的数据可以通过回放WAL来恢复

读机制

类似于MemStore，HBase在读的时候也维护一个内存的缓存区，基于LRU算法的BlockCache，用来保存从HFile里读入内存的频繁访问的数据。它和MemStore在同一个JVM堆里，所以类似的，每个列族都有一个BlockCache

Block是HBase从硬盘完成一次读取的数据单位，类似于操作系统中文件系统的block。
HFile的物理存放模式是：一个Block的序列＋这些block的索引。所以，从HFile读取一个Block时需要先在索引上查找一次该block然后从硬盘读出。

block大小是可设置的。

对于主要用于随机访问，可采用细粒度的block，这样索引表变大，但是数据传输量变小。
对于主要用于顺序扫描&#

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。