HBase

观华x

于 2023-04-06 13:22:16 发布

阅读量220

点赞数 1

文章标签： hbase 数据库大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_60332601/article/details/129981681

版权

从BigTable说起:

HBase的前身是BigTable，BigTable谷歌的一个分布式存储系统，利用谷歌提出的MapReduce分布式并行计算模型来处理海量数据，使用谷歌分布式文件系统GFS作为底层数据存储，采用Chubby提供协同服务管理，可以扩展到PB级别的数据和上千台机器，具备广泛应用性、可扩展性、高性能和高可用性等特点。

HBase介绍:

HBase是一个通过廉价机器集群来完成海量数据高速存储及读取的分布式面向列的开源数据库解决方案。

HBase数据模型:

表：HBase的数据同样是用表来组织的，表由行和列组成，列分为若干个列族，行和列的坐标交叉决定了一个单元格。

行：每个表由若干行组成，每个行有一个行键作为这一行的唯一标识。访问表中的行只有三种方式：通过单个行键进行查询、通过一个行键的区间来访问、全表扫描。

列族：一个HBase表被分组成许多“列族”的集合，它是基本的访问控制单元。

列修饰符（列限定符）：列族里的数据通过列限定符（或列）来定位

单元格：在HBase表中，通过行、列族和列限定符确定一个“单元格”（cell），单元格中存储的数据没有数据类型，总被视为字节数组byte[]

时间戳：每个单元格都保存着同一份数据的多个版本，这些版本采用时间戳进行索引

HBase特点:

1. HBase有4个维度来确定某个具体的值

Hbase中具体的数值，叫单元格， Hbase的读写都是以单元格进行的

维度为: RowKey/ColumnFamily/Column/Timestamp

Row Key键是唯一确定的标记,按字典序进行排序。只能存64k的字节数据。实际上，row key存满64k的几率不大，因为row key弄太大了，效率就低了

Time Stamp时间戳即版本信息默认为1

2. 数据强一致性

3. 是稀疏多维的列表

4. 有稀疏多维的Map

BigTable本质上是一个Map结构数据库,Hbsae亦然,也是由一系列KV构成

HBaseMap有很多限定词:稀松的/持久的/排序的/多维的/持久性的

它与普通Map不同虽然都是KV组成但HBaseMap的Key是一个复合健

由 rowkey、ColumnFamily、Column、Timestamp组成

5. 拥有HDFS压缩存储

6. 自动水平扩展

7. 服务器自动调整平衡

(1) HDFS为Hbase提供可靠的底层数据存储服务

(2) MapReduce为Hbase提供稳定的计算能力

(3) Zookeeper为Hbase提供稳定的服务以及Failover机制

因此我们说Hbase是一个通过大量廉价的机器解决海量数据的高速存储和读取的分布式数据库解决方案

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
3
评论
HBase

HBase的前身是BigTable，BigTable谷歌的一个分布式存储系统，利用谷歌提出的MapReduce分布式并行计算模型来处理海量数据，使用谷歌分布式文件系统GFS作为底层数据存储，采用Chubby提供协同服务管理，可以扩展到PB级别的数据和上千台机器，具备广泛应用性、可扩展性、高性能和高可用性等特点。HBase的数据同样是用表来组织的，表由行和列组成，列分为若干个列族，行和列的坐标交叉决定了一个单元格。HBaseMap有很多限定词:稀松的/持久的/排序的/多维的/持久性的。
复制链接

扫一扫

观华x CSDN认证博客专家 CSDN认证企业博客

码龄3年

3: 原创

158万+: 周排名

109万+: 总排名

443: 访问

: 等级

35: 积分

5: 粉丝

2: 获赞

5: 评论

0: 收藏

私信

关注

热门文章

最新评论

Flume构成
CSDN-Ada助手: 恭喜您写了这篇关于Flume构成的博客，看得出您对这个主题有深入的了解。希望您能够继续保持这种创作热情，多写一些关于Flume的实践经验或者案例分析，让读者更深入地了解这个工具。期待您的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3
Flume构成
CSDN-Ada助手: 恭喜作者写出了关于Flume构成的博客！通过这篇文章，我更深入地了解了Flume的架构和组成部分。接下来，我建议作者可以深入探讨Flume的应用场景以及如何优化Flume的性能。期待作者的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3
HDFS设计特点之利用DMA引擎的零拷贝
CSDN-Ada助手: 非常棒的博客，你对DMA引擎的介绍非常清晰明了，让我对这个技术有了更深入的了解。希望你能继续分享更多关于HDFS设计的特点和技术。除了DMA引擎，还有一些其他的零拷贝技术，比如sendfile()和splice()，它们也能够提高数据传输的效率，可以作为你下一篇博客的主题。期待你的精彩分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
HBase
CSDN-Ada助手: 恭喜你开始博客创作，我很期待看到你对于HBase的深入探究和思考。希望你继续努力，不断学习，分享更多有价值的知识。推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804
HBase
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/614492771。

大家在看

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。