Hbase历史、特点、使用场景和原理

最新推荐文章于 2022-04-09 10:00:00 发布

清蒸小土豆

最新推荐文章于 2022-04-09 10:00:00 发布

阅读量497

点赞数

分类专栏： Hbase

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Little_good/article/details/115097636

版权

Hbase 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

Hbase是什么

hbase的历史

Hbase开始于谷歌发表的一片论文《大表：一个半结构化数据的分布式存储系统》，最初的开发人员是MichaelStack和JimKellerman，他们看了谷歌的论文写了hbase程序，2007年4月，HBase做为一个模块提交到Hadoop的代码库中，代码量~8000行，2010年5月HBase成为Apache的顶级项目。
hbase加入hadoop生态为hbase社区发展带来了巨大的便利，但是依赖于hdfs和MapReduce使得hbase不太适合处理小数据。

hbase特点和使用场景

高可靠性： hdfs存储副本
高性能： mr程序利用多台机器的计算能力
可伸缩性：扩展存储资源和运算资源都很容易（hadoop特性）
列式存储：按key value 存储的字节数据
单维度查询较快，支持高并发，稀疏表但不会占用空间

适合使用：单一维度查询
单表数据千万，并发量高
不够灵活，处理时间较长
不适合使用：需要数据分析，数据不超过千万

原理

使用前准备

1 zookeeper正常运行 hbase借助zk维护集群
2 hdfs正常 hbase接触hdfs存储数据
3所有节点的时间同步

client

提供访问接口

zookeeper

1通过选举保证集群中只有一个leader
2master 和regionserver启动时会向zk注册
3存储所有region的寻址入口存储hbase元数据索引表 —meta—具体的机器
4监控 regionserver的上下线

hmaster

1分配数据存储在哪个regionserver上
2为regionserver 分配数据
3负责负载均衡
4发现失效的regionserver 重新分配上面的region
5管理用户操作

regionserver

1管理master为期分配的region
2处理客户端的读写请求
3负责和底层的hdfs交互，存储到hdfs上
4负责region的拆分
5storefile的合并
6负载均衡

清蒸小土豆

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。