走向云计算之HBase的基本原理和架构介绍

最新推荐文章于 2022-03-22 12:09:43 发布

VIP文章想作会飞的鱼

最新推荐文章于 2022-03-22 12:09:43 发布

阅读量1.1k

点赞数

分类专栏：云计算Hadoop 文章标签： hbase hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaokang123456kao/article/details/73293913

版权

一、概述

HBase是一个构建在HDFS上的分布式列存储系统；HBase是Apache Hadoop生态系统中的重要一员，主要用于海量结构化数据存储；从逻辑上讲，HBase将数据按照表、行和列进行存储。它介于nosql和RDBMS之间，仅能通过主键(row key)和主键的range来检索数据，仅支持单行事务(可通过hive支持来实现多表join等复杂操作)。主要用来存储非结构化和半结构化的松散数据。与hadoop一样，Hbase目标主要依靠横向扩展，通过不断增加廉价的商用服务器，来增加计算和存储能力。因为HDFS适合批处理场景，不支持数据随机查找，不适合增量数据处理，也不支持数据更新，而HBase的出现正好解决了HDFS不能解决的问题。
下面一幅图是Hbase在Hadoop Ecosystem中的位置。
这里写图片描述

二、HBase表的特点

大：一个表可以有数十亿行，上百万列；
无模式：每行都有一个可排序的主键和任意多的列，列可以根据需要动态的增加，同一张表中不同的行可以有截然不同的列；
面向列：面向列（族）的存储和权限控制，列（族）独立检索；
稀疏：对于空（null）的列，并不占用存储空间，表可以设计的非常稀疏；
数据多版本：每个单元中的数据可以有多个版本，默认情况下版本号自动分配，是单元格插入时的时间戳；
数据类型单一：Hbase中的数据都是字符串，没有类型

HBase采用列存储形式。列存储不同于传统的关系型数据库（数据在表中是按行存储的），列方式所带来的重要好处之一就是，由于查询中的选择规则是通过列来定义的，因此整个数据库是自动索引化的。按列存储每个字段的数据聚集存储，在查询只需要少数几个字段的时候，能大大减少读取的数据量，一个字段的数据聚集存储，那就更容易为这种聚集存储设计更好的压缩/解压算法。下图讲述了传统的行存储和列存储的区别：
这里写图片描述

三、HBase的数据模型

HBase是基于Google BigTable模型开发的，典型的key/value系统；

最低0.47元/天解锁文章

想作会飞的鱼

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
走向云计算之HBase的基本原理和架构介绍

一、概述HBase是一个构建在HDFS上的分布式列存储系统；HBase是Apache Hadoop生态系统中的重要一员，主要用于海量结构化数据存储；从逻辑上讲，HBase将数据按照表、行和列进行存储。它介于nosql和RDBMS之间，仅能通过主键(row key)和主键的range来检索数据，仅支持单行事务(可通过hive支持来实现多表join等复杂操作)。主要用来存储非结构化和半结构化的松散数据。
复制链接

扫一扫

专栏目录

想作会飞的鱼 CSDN认证博客专家 CSDN认证企业博客

码龄11年

253: 原创

8万+: 周排名

124万+: 总排名

120万+: 访问

: 等级

1万+: 积分

1023: 粉丝

780: 获赞

237: 评论

2977: 收藏

私信

关注

热门文章

分类专栏

最新评论

Java设计模式的常见应用场景
天蓝999: 可以的，我看的另一个神仙级Java设计模式实战，它结合SpringBoot，我彻底学会了Java设计模式及应用，见：https://knife.blog.csdn.net/article/details/131900171
K-Means算法的Hadoop实现
不懂it的it的书生: 初始的存放中心点的center文件需要自己创建，文章里没有提到
Python中输入和输出
??Jack Li:
基于密度的聚类算法(Clustering by fast search and find of density peaksd)
bugJi — NWNU: 博主我有个问题请教一下，这个算法说是可以得到非球型数据的聚类结果。但是按他这个算法说的，聚类中心是密度最大的点，也就是说聚类中心一定在数据点上，但非球形数据聚类中心不一定在数据点上（例如一个空心半圆型的数据，他的聚类中心就不在数据点上），如果按照算法上说的找出聚类中心，再对其他点进行就近分配的话，得出来的结果与k-means的结果是一样的，无法处理非球形数据。还请博主解答一下，感谢。
基于struts2的学生报道管理系统（附github源码地址）
潇萧笑: 楼主能发一下mysql文件么，非常感谢[email protected]

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。