1、Hbase的存储机制
1、Hbase中存在一个叫做列簇的概念,一个列簇下面保存多个列,所谓的列簇指的就是一组列
2、Hbase中没有主键的概念,但是存在行键的概念(rowkey),可以把行键理解为主键,一条记录的唯一标识
3、版本:version 用于标识更新的数据 ,也可以作为数据的检索项
4、最小的存储单元cell单元格
5、在进行检索数据的时候,可以通过 以下方式进行单元格数据的唯一确定
6、cell单元格格式:rowkey+列簇+时间戳+value 找到数据内容
示例:
rowkey :1001
column famliy1:info
name:zhangsan
age:18
sex:nan
column famliy1:info2
addr:beijng
phone:137
2、Hbase的寻址机制
官方图:
自己画图:
文字描述:
1、Client向ZK发出请求;
2、ZK返回root表所在的位置
3、客户端向root表所在的regionserver发出请求
4、root表返回meta表所在的位置,缓存寻址地址
5、Client向meta表所在的regionserver发出请求
6、meta表返回数据的存储位置
7、Client端向数据所在的regionserver发出请求
8、regionserver将请求发给region
9、在region内查找memstore
10、regionserver通过hdfsAPI向hdfs获取数据
11、regionserver返回结果给Client