1、主要内容
-
1、掌握Hbase相关概念
-
2、掌握Hbase集群搭建
-
3、掌握Hbase shell 命令的使用
-
4、掌握Hbase内部原理
-
5、掌握Hbase的寻址机制
-
6、掌握Hbase的rowkey设计
2、Hbase概述
2.1 hbase是什么
hbase是基于hdfs进行数据的存储,具有高可靠、高性能、列存储、可伸缩、实时读写的nosql数据库系统。
可以按照主键(rowkey)和主键的范围去查询数据,后期查询数据的性能也是非常高。
2.2 hbase表的特性
-
1、大
-
hbase表中可以存储海量的数据
-
-
2、无模式
-
hbase表中不同的行可以有截然不同的列,这一点跟mysql不一样。
-
-
3、面向列
-
hbase表中的数据是面向列进行存储,这一点跟mysql不一样。
-
-
4、稀疏
-
hbase表中为null的列,可以不占用实际的存储空间
-
-
5、数据的多版本
-
hbase表中的字段的结果可以存储多个不同的值,每一个值都给一个版本号,这个版本号就是按照数据的插入时间它的时间戳去确定。时间戳就是数据的版本号
-
-
6、数据类型单一
-
hbase表中的数据都是按照字节数组进行存储
-
2.3 hbase表的逻辑视图
3、hbase集群结构
-
1、client
-
hbase客户端的api的接口
-
-
2、zookeeper
-
搭建hbase集群的时候需要依赖于zk集群
-
作用
-
1、实现了hbase集群的高可用
-
2、保存了所有hbase表的寻址入口,客户端需要操作hbase表的时候,需要连接上zk集群
-
3、接受HMaster和HRegionServer注册和心跳信息,后期某一个HRegionServer挂掉了, zk会感知到,把这个信息通知给HMaster
-
-
-
3、HMaster
-
它是hbase集群的老大
-
作用
-
<
-
-