一、Hbase简介
1.1
Apache Hbase 是Hadoop数据库,一个分布式、可伸缩的大数据存储。
1.2 Hbase的特点
大:一个表可以有数十亿行,上百万列。
无模式:每行都有一个可排序的主键和任意多的列,列可以根据需要动态增加,同一张表中不同的行可以有截然不同的列;
面向列:面向列(族)的 存储和权限控制,列(族)独立检索;
稀疏:对于空的列,并不占用存储空间,表可以设计的非常稀疏;
数据多版本:每个单元的数据可以有多个版本,默认情况下版本号自动分配,是单元格插入时的时间戳;
数据类型单一: Hbase 中的数据都是字符串,没有类型。
二、Hbase 的角色
2.1 Hmaster 功能:
- 监控RegionServer
2.处理RegionServer 的故障转移
3.处理数据的变更
4.处理region的分配或转移
5.在空闲时间进行数据的负载均衡
6.通过Zookeeper发布自己的位置给客户端
2.2 RegionServer
功能:
1.负责存储Hbase的实际数据
2.处理分配给他的Region
3.刷新缓存到HDFS
4.维护Hlog
5.执行压缩
6.负责处理Region分片
组件:
1.Write-Ahead logs
Hbase 的修改记录,当时Hbase读写数据的时候,数据不是直接写进磁盘,它会在内存中保留一段时间。但把数据保存在内存中可能有更高的概率引起熟路丢失&#x