HBase读书笔记

最新推荐文章于 2024-07-24 21:14:44 发布

u2244118984

最新推荐文章于 2024-07-24 21:14:44 发布

阅读量462

点赞数

分类专栏： hadoop 文章标签： hbase 存储

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u2244118984/article/details/41623735

版权

hadoop 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

读写首先根据rowid定位到reginserver：Zookeeper→-ROOT-→-META-→ReginServer

-META-表中存储了Regionserver的region分区信息，如果某台Regionserver挂掉（通过Zookeeper感知），那么master可以把托管在这台RegionServer上的regin分区分配到其他RegionServer上。

存储的最小单位是block，那么索引的最小单位也是block。

读缓存blockCache，写缓冲Memstore，都是针对一个列簇讲的。

读会查询blockCache，Memstore，HFile三个区域的信息。

写到WAL和Memstore后成功返回，当Memstore满的时候，有一个后台线程把memstore中的内容写到HDFS中形成一个HFile。为了提高读性能，会做小合并（部分HFile参与），大合并（一个列簇的所有HFile参与，这时候会把有delete标记的记录彻底清理掉）

HBase类似于聚簇索引表，而每个Region就是叶节点。另外Hbase只能保证行内事务，但是使用类似思想实现的分布式数据库（cobar）可是做到单台server内的事务。

HBase通过把一张表分散成不同的region保存在不同的RegionServer上，从而保证了表的容量可以无限扩展，HDFS的数据本地性保证了读写性能不会降低，replication保证了数据的安全性。但是牺牲了传统数据库的ACID特性。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HBase读书笔记

读写首先根据rowid定位到reginserver：Zookeeper→-ROOT-→-META-→ReginServer-META-表中存储了Regionserver的region分区信息，如果某台Regionserver挂掉（通过Zookeeper感知），那么master可以把托管在这台RegionServer上的regin分区分配到其他RegionServer上。存储的最小单位是bl
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。