HBase 学习第 3 天：HBase 数据模型及架构详解

最新推荐文章于 2023-07-25 09:45:53 发布

坚强的小土豆

最新推荐文章于 2023-07-25 09:45:53 发布

阅读量478

点赞数 1

分类专栏： HBase 大数据文章标签：大数据 HBase

原创不易，转载请注明出处！

本文链接：https://blog.csdn.net/weixin_43129750/article/details/103049341

版权

本文详细介绍了HBase数据库的定义、来源，重点解析了HBase的数据模型，包括RowKey、时间戳、列族和单元格的概念。此外，文章还概述了HBase的特性、架构设计以及各个角色的功能，如Client、Zookeeper、HMaster和HRegionServer等。

摘要由CSDN通过智能技术生成

一、HBase 数据库是什么

HBase 是一个高可靠性、高性能、面向列、可伸缩、实时读写的分布式数据库
HBase 是一个利用 HDFS 来存储数据、利用 MapReduce 来处理数据、利用 Zookeeper 作为其分布式协同服务
HBase 主要用于存储非结构化和半结构化的松散数据—NoSql 数据库
HBase 的数据读写是将数据作标记，删除数据时并不是将数据直接在磁盘中删除，读取的时候是看标记

二、HBase 从哪里来

HBase 是来源于 Fay Chang 所撰写的 Google 论文 “Bigtable ：

一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统（FileSystem）所提供的分布式数据存储一样，HBase在Hadoop之上提供了类似于Bigtable的能力。HBase 是 Apache 的 Hadoop 项目的子项目。HBase不同于一般的关系数据库，是一个适合于非结构化数据存储的数据库。

三、HBase 数据模型

HBase 数据模型是稀疏结构的数据，数据存储模型如下图所示：
2324243

如上图所示，以关系型数据的思维会感觉这是一张表，但是在 HBase 中这种理解是错误的，在 HBase 中上面的表格显示的只是一行数据；其中各单元格标题描述如下所示

1、RowKey

（1）决定一行数据的唯一标识

（2） RowKey 是按照字典顺序排序的

（3）RowKey 最多只能存储64k的字节数据，RowKey 设计越短越好

（4）Column Family列族（CF1、CF2、CF3） & qualifier列：

HBase表中的每个列都归属于某个列族，列族必须作为表模式(schema) 定义的一部分预先给出。如create ‘test’, ‘info’；
列名以列族作为前缀，每个“列族”都可以有多个列成员(column，每个列族中可以存放几千~上千万个列)；如 CF1:q1, CF2:qw,
新的列族成员（列）可以随后按需、动态加入，Family下面可以有多个 Qualifier，所以可以简单的理解为，HBase中的列是二级列,也就是说 Family 是第一级列，Qualifier 是第二级列。两个是父子关系
权限控制、存储以及调优都是在列族层面进行的
HBase把同一列族里面的数据存储在同一目录下，由几个文件保存
目前为止 HBase 的列族能够很好处理最多不超过3个列族

最低0.47元/天解锁文章

坚强的小土豆

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。