前文:
HBase是建立在Hadoop文件系统之上的分布式面向列的数据库。
一、概念
1、HBase概念
2、数据库类型对比
3、数据库存储类型对比
4、应用场景
注:不适合低延迟访问!
二、结构
1、HMaster
2、HRegion
3、HRegionServer
4、HRegionServer宕机处理
5、架构图
三、读写流程
1、读取流程
2、读取优化
备注:Compaction机制:用于减少HFile数量
3、写入流程
三、设计及性能瓶颈、优化
1、HBase表的设计
注:Rowkey:散列字段(程序生成)+时间戳,提高负载均衡几率。
2、瓶颈
备注:不支持多条件查询、不适合大范围扫描查询、不直接支持 SQL 的语句查询
3、优化
4、Region大小
5、性能总结
四、操作
1、基本操作指令
五、补充
1、LSM-TREE