hbase基本概念及使用注意事项
hbase的特点
- 多维:key是复合的,列族,列,rowkey,时间戳,操作类型构成物理存储的key
- 稀疏:同行下不同的列可以为空,不填充null,由于列可以无限扩展这会导致空间浪费
- 排序:rowkey->column(列族+列)->timestamp
- 分布式:依托于hadoop,一个表可以有多个region,每个region可以存在不同的region server上,region server对应于hadoop的dataNode
hbase的设计目标
hbase的设计目标是成为HTAP(Hybrid Transactional and Analytical Processing )型数据库。
hbase是列式存储数据库,这个是根据物理视图来看,hbase底层是按照每个列来存储数据,一般我们使用hbase shell可以看到结构
rowkey->列族
|-列
|-value,时间戳
这是逻辑视图。
hbase基本概念
namespace
:相当于库名
table
:表名,一个表由多个region组成
region
:一个表的数据分片,可以预分区也可以自行分裂,根据配置触发region分裂
region server<