HBase 基本概念
- 存储的是松散型的数据类型
- 在HBase中行健按照字典序升序存储
- 基于行健,列键,时间戳建立索引
- HBase客户端访问方式包括API、使用HBase Shell访问、通过控制台进行访问
- HBase在Hadoop上通过HDFS系统存储底层数据,可实现多机同时读写
- HBase是一个稀疏的长期存储的,多维度的,有序的映射表,该表的索引是行健,列关键字和时间戳
HBase 的基本特点
- 适合高读写的场景
- 存储稀疏矩阵
- 分布式,适合集群化运行
- 非结构化
- 开源
- 列式数据库
常见的大数据库产品
Google的BigTable
Apache的Cassandra、HBase
HBase相关
.META.存储的是用户表的信息(元数据)即:在哪一个用户的哪一个region里
在HBase物理模型中客户端检索数据时,先在内存中找,找不到时再去磁盘中找
Client如何从HBase中查询数据
zookeeper file中记录了-ROOT-表的Location
-ROOT-
记录了.META表的Region信息
-ROOT- 只有一个Region
将.META中的Region映射到Region Server上
该表主要存储了.META服务器位置以及映射了那些META Region
.META
记录了用户表的Region信息
.META可以有多个Region
包括Region中数据起止行信息,Region“在线”状态等
保存Region Server的地址
WAL
预写日志文件,操作先记录进日志,然后数据才写入。
Client初始化一个修改数据的操作,put或者delete,这些操作封装在一个K