什么是HBase
1、HBase是一种分布式、可扩展、支持海量数据存储的NoSQL数据库。
2、逻辑上,HBase的数据模型同关系型数据库很类似,数据存储在一张表中,有行有列。但从HBase的底层物理存储结构(K-V)来看, HBase更像是一个mutil-dimensional map
3、如下图[1]所示,HBase有一列 “行键“ —— row key,row key是在建表时就要指定的,必须是唯一的(主键)。如果插入一条数据的row key列与表内重复,则会对表内该row key对应行进行更新;row key按字典序排列,所谓字典序指的是按位比较,如 row_key1<row_key11<row_key111<row_key2<row_key21<row_key3
每一行数据由一个行键来标识,我们在查询HBase中的数据时就是通过行键来定位的。一般的查询有三种方式,①根据行键查询,②根据行键范围查询,③全表扫描
4、如下图1[1]把HBase的存储结构分为逻辑结构和物理结构两个部分, Column Family指列簇,列簇包含一个或多个列,竖着切表得到列簇;列簇是Hbase元数据的一部分,在创建HBase表的时候不需要创建列因为它可以在表创建之后动态的添加。它不是元数据的一部分。创建表的时候必须指定列簇。就像关系型数据库创建的时候必须指定具体的列是一样的。
5、横着切表得到region,一个