HBase 是一个通过大量廉价机器解决海量数据的调整存储和读取的分布式数据库解决方案
HBase 的特点:
- 高并发,易扩展,解决海量数据集的随机实时增删改查
- HBase 本质依然是 Key-Value 数据库,不支持 join 等复杂操作
- 不支持复杂的事务,只支持行级的事务
- HBase 中支持的数据类型:byte[] (底层所有数据的存储都是字节数组)
- 主要用来存储结构化和半结构化的松散数据
HBase 中表的特点:
- 大:一个表可以有上十亿行,上百万列
- 面向列:列可以灵活指定,面向列(族)的存储和权限控制,列(族)独立检索
- 稀疏:对于为空(null)的列,并不占用存储空间,因此,表可以设计的非常稀疏
- 无严格模式:每行都有一个可排序的主键和任意多的列,列可以根据需要动态的增加,同一张表中不同的行可以有截然不同的列
1. HBase 的表结构
HBase 的本质是 Key-Value 数据库,Key 是行键 RowKey,value 是所有真实 key-value 的集合。
HBase 可以抽象成为