Hbase:
是一个构建在Hdfs基础之上的非关系型数据库。**
是一个高可靠、高性能、面向列、可伸缩的分布式存储系统,目标是存储并计算大型的数据,具体来说就是在非常普通的硬件配置,就能够处理成千上万的行和列组成的大型数据。
关系型数据库和非关系型数库的明显区别:Nosql往往使用api操作,关系型数据习惯与使用sql语句操作
特点:
1.海量存储 -->基于Hdfs
2.列式存储
3.极易扩展
(1)添加datanode机器,进行存储层扩容,提升Hbase的数据存储能力和提升后端存储的读写能力;
(2)添加RegionServer机器,提升Hbase上层的处理能力,提升Hbase服务更多Region的能力。
4.高并发
5.稀疏
由于采取列式存储,某一列没有数据不会占有磁盘空间,所有说是稀疏的
Hbase的架构:
Hbase的相关组件
client:包含访问Hbase的接口,还维护对应的cache来加速对Hbase的访问(如缓存.META元数据信息)
Zookeeper: