第六章分布式数据库Hbase
Hbase是什么:分布式存储系统(数据库)
特点:
高可靠(节点数据都有备份)
高性能(节点/机器多)
面向列(传统的是面向行)
可伸缩(可以拓展和删除节点)
目标:
存储并处理大型(行列组成的)数据
和传统数据库的区别:
可拓展,有增加节点实现
存在HDFS上,备份机制完善
有zookeeper协调服务,访问速度快//对应的就是传统数据库的区别
角色:
Hmaster:有一或多个;主节点
管理下面和对他进行表分配
对表的节点(结构、元数据)增删改查
HregionServer:多个从节点
表数据的增删改查
和hdfs交互,真正存储数据
Hbase架构图:
由HMaster管理HregionServer,实现对大型、海量行列数据的增删改查,并由regionServer和hdfs进行交互,实现存储数据;
整个过程,是由zookeeper进行服务协调,这也是zookeeper本身的作用,在多个过程中都是这个作用。其实,当有多个如HMaster这样的时候,往往需要调控要那个进行实际工作,这时候就需要zookeeper来进行协调服务。
另外还用于:存放整个Hbase集群元数据和集群的状态信息(也比较好理解,要想做好协调的工作,肯定要知道整个的状态信息,并存放整个hbase几群的元数据:如果没有,当一台HMaster宕机的时候另一台怎么继承元数据;另一种思路,由一台HMaster协调(由failover)到另一台HMaster时候,第二胎继承了什么,zookeeper就得有什么~
数据类型:
行键
时间戳:1970-01-01 00:00:00 到当前时间的秒数
列族