HBase笔记(二)

一、HBase的相关概念

1、Table

2、Row

3、Column

4、Column Family

5、Column Qualifier

6、Cell

7、Timestamp

二、HBase的特点

1、容量大

HBase是一个集群无限扩展

2、面向列

数据是以列为单位存储的,单独对列进行各种操作

3、稀疏性

数据结构是稀疏矩阵,允许表的列为空,空列不占存储空间

4、数据多版本

HBase是由表组成,表中有很多单元格,单元格里有数据,数据有多个版本

5、扩展性

HBase的底层是HDFS,动态添加节点来扩容

6、高可靠性

HBase的底层是HDFS,HDFS有备份机制,所以保证了数据的高可靠性

三、HBase数据库和传统数据库的区别

1、存储模式

传统数据库中是基于行存储的;而HBase是基于列进行存储的

2、表字段

传统数据库中的表字段不超过30个;而HBase中表字段不做限制

3、可延伸性

传统数据库中的列是固定的,需要先确定列有多少才会增加数据去存储;
而HBase是根据数据存储的大小去动态的增加列,列是不固定的。

四、HBase的数据模型

1、概念

作业:

画出对应的逻辑模型和物理模型

idnameagesexjobs
1张三35教师
2李丹18学生
3John26IT工程师

逻辑模型

RowKey列族 CF1列族 CF2
id=1CF1:name="张三"CF2:sex="男"
CF1:age="35"CF2:jobs="教师"
id=2CF1:name="李丹"CF2:sex="女"
CF1:age="18"CF2:jobs="学生"
id=3CF1:name="John"CF2:sex="男"
CF1:age="26"CF2:jobs="IT工程师"

物理模型

RowKey单元格
id=1CF1:name张三
id=1CF1:age35
id=1CF2:sex
id=1CF2:jobs教师
id=2CF1:name李丹
id=2CF1:age18
id=2CF2:sex
id=2CF2:jobs学生
id=3CF1:nameJohn
id=3CF1:age26
id=3CF2:sex
id=3CF2:jobsIT工程师

五、HBase的系统架构

在这里插入图片描述

1、Client(客户端)

目的:操作数据库
使用RPC机制与HMaster和HRegionServer进行通信并维护Cache来加快对HBase的访问

2、ZooKeeper

ZooKeeper的作用

1)记录了HBase中的元数据信息
2)监控从节点HRegionServer的状态,汇报给HMaster
3)保证HBase集群只有一个HMaster在工作

3、HMaster(主节点)

HMaster的作用

1)实现HRegionServer之间处理数据的负载均衡
2)负责哪一个Region需要放在哪一个RegionServer上,负责HRegion的发配
3)管理用户对表的增删改查操作
4)发现失效的HRegionServer并重新分配其上的HRegion
5)处理元数据的更新请求
6)当HRegion切分后,负责两个新生成HRegion的分配

4、RegionServer

HLog(预写日志)

保证可靠性

5、HRegion

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

喝着奶茶敲实验

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值