HBase 数据模型

最新推荐文章于 2022-06-27 23:32:21 发布

热爱Coding

最新推荐文章于 2022-06-27 23:32:21 发布

阅读量2k

点赞数

文章标签： hbase 数据库

HBase，也是Apache HBase，是一个分布式、列存储的数据库，HBase是根据谷歌的BigTable理论开发，就像是谷歌的BigTable在Google文件系统之上发挥的作用一样，HBase在Hadoop之上发挥同样的作用。

1.HBase的数据模型
数据以表的形式存储，也就是有行和列，不过Hbase的表是一个多维的map。

1.1 HBase的Table
HBase的Table由多个行组成

1.2 HBase 的行
HBase的行由行的Key和一个或多个列组成，行在存储的时候，行Key按字母表顺序存放。

1.3 HBase的列
一个HBase的列由列family和列qualifer组成

1.4HBase的列family
列family由一组列和列值组成，出于性能方面的考虑，每个列family有一些存储参数，比如数据是否在内存缓存、数据怎样压缩的。每行由相同的列family组成。

1.5Hbase的列qualifier
每个列family有一个列qualifier，列qualifier的作用是作为列数据的一个标识，比如一个列family是content，那么这个列的列qualifier会是content：html或者content：pdf之类。

1.6HBase的cell
一个cell是行和列family、列qualifier、一个时间戳的组合。{行，列，版本}的一个三元组确定一个cell

1.7Hbase的时间戳
时间戳和每个cell值一起被写入，默认时间戳标识HBase的RegionServer写该数据的时间。

1.8HBase的数据模型的实例
如下图所示，这是一个命名为webtable的表，有两行数据，即com.cnn.www和com.example.www，和三个列family，这三个列family分别命名为contents，anchor，people。

在这个例子里，第一行（com.cnn.www）的anchor列family包含两列，即cssnsi.com和my.look.ca，以及contents列family包括一列，即html。

这个例子的com.cnn.www行包含5个版本的cell的数据，com.example.www包含1个版本的cell的数据。

这个例子里，列qualifier的意思就是列family：列qualifier，比如contents：html或者 anchor：cnnsi.com。

这个例子里，引号里面的就是cell的值。
HBase

2.HBase的使用
四个主要的数据操作是Get、Put、Scan和Delete。所有的数据操作HBase都会以有序的方式返回数据，首先按行，然后按列family，然后按列qualifier，最后按时间戳（时间戳是倒排的，以便最新的数据首先返回）

2.1Get操作
Get操作返回一个特定的行。

2.2Put操作
如果行Key不存在，Put操作可以加一个新行，如果行Key存在，则更新这个相同行Key的行。

2.3Scan操作
Scan操作可以根据给定的条件遍历数行。

2.4Delete操作
Delete操作可以从一个表里删除一行

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
HBase 数据模型

HBase，也是Apache HBase，是一个分布式、列存储的数据库，HBase是根据谷歌的BigTable理论开发，就像是谷歌的BigTable在Google文件系统之上发挥的作用一样，HBase在Hadoop之上发挥同样的作用。1.HBase的数据模型数据以表的形式存储，也就是有行和列，不过Hbase的表是一个多维的map。1.1 HBase的Table HBase的Table由多个行
复制链接

扫一扫

热爱Coding CSDN认证博客专家 CSDN认证企业博客

码龄14年

1598: 原创

8845: 周排名

177: 总排名

444万+: 访问

: 等级

5万+: 积分

1016: 粉丝

883: 获赞

944: 评论

1772: 收藏

私信

关注

热门文章

分类专栏

最新评论

ElasticSearch 的 DisMaxQueryBuilder 的理解
kenzsoft: 学到了！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
【搜索算法】靠item标签召回，超越ElasticSearch+分词的baseline
普通网友: 支持一下！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
ElasticSearch 的 DisMaxQueryBuilder 的理解
2401_84182020: 干货满满！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
ElasticSearch 的 ConstantScoreQuery 的理解
普通网友: 学到了！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
【搜索算法】靠item标签召回，超越ElasticSearch+分词的baseline
2401_84166672: 好文！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章

最新文章

2024

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。