Hbase原理解读（七）-- Hbase常见问题总结

最新推荐文章于 2024-08-05 21:43:10 发布

暁洣

最新推荐文章于 2024-08-05 21:43:10 发布

阅读量318

点赞数

分类专栏： HBase 文章标签：大数据 hbase

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43192721/article/details/99571048

版权

这是HBase原理解读系列的最后一篇。在对HBase进行原理总结的时候遇到的一些常见问题进行总结。

1. 为什么hbase可以很快？

HBase的内部有memStore做缓冲,读写都是有限基于内存实现的。所以读写的效率高。
HBase中存储的数据是按照行键的字典顺讯进行排序的，所以查询效率高。
HBase中存储的数据从水平方向上切分为若干个HRegion，进行分布式的存储，所以提高效率。

2. 为什么hbase可以存储很多数据？

HBase中的数据最终是存储到HDFS上的,而HDFS是分布式的存储系统,可以动态扩容,基本可以认为Hbase的存储容量是没有限制的。
Hbase中的空数据不占用空间,当数据比较稀疏时,不会浪费空间
hbase按列存储数据,而同一个列中的数据数据结构往往类似,可以实现高下率的数据压缩,节省空间

为什么hbase的是可靠的？

Hbase中存储的数据最终存储在HDFS中,而HDFS自带多副本机制，可以保证高可靠
Hbase中存在多个HRegionServer,即使某些HRegionServer宕机,HBase也可以恢复数据到其他HRegionServer继续工作
HMaster提供了备用机制,可以自动在HMaster 和 BackUpHMaster之间切换

hbase和hive和传统的关系型数据库的比较

比起传统的关系型数据库：
- 可以存储半结构化、非结构化的数据。
- 可以存储和处理更大级别的数据，提供高效的查询。
- 对于稀疏数据的处理更好。
- 具有更好的横向扩展性。

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hbase原理解读（七）-- Hbase常见问题总结

HBase表设计概述HBase的表设计将会直接影响：HBase表使用的效率及便利性，并且 HBase的表的结构一旦确立下来之后很难更改,所以在创建HBase表时，需要对表结构进行设计。HBase中的表设计主要设计的是：行键和列族HBase表中的列族设计在设计HBase表时,列族不宜过多,越少越好,官方推荐不要超过3个。经常要一起查询的数据不要放在不同的列族中,尽量减少跨列族的数据访...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。