HBase 的架构相对于其他大数据框架的架构来说是较为复杂的
HBase特点具有:
列式海量储存, 稀疏性, 列数据可为空, 且不占用空间
极易扩展, 储存空间添加 DataNode 节点, 处理性能添加 HRegionServer 节点
高可用, 利用 Zookeeper
高并发
架构中的角色
1. Client
包含了访问 Hbase 的接口,维护对应的 cache 来加速对 Hbase 的访问,例如 cache 的 .META. 元数据信息
2. Zookeeper
HBase 通过 Zookeeper 来做 Hmaster 的高可用、HRegionServer 的监控、元数据的入口以及集群配置的维护等工作
通过 Zoopkeeper 来保证集群中只有1个 Hmaster 在运行,如果 Hmaster 异常,会通过竞争机制产生新的 Hmaster 提供服务
通过 Zoopkeeper 来监控 HRegionServer 的状态,当 HRegionSevrer