1.hbase
①hbase是一个面向列存储的分布式存储系统,可以实现高性能的并发读写操作,对数据进行透明的切分。
②hbase有两个主要概念,row key(行健),column family(列簇)。每个列簇包含多个列。row key 是hbase中记录的唯一标识。
③hbase中列可以动态增加。eg:定义user表,然后定义info列簇,user数据可以分为info: name,info: age。如果以后要增加属性,只需info: 新属性,即可 。
④表的某一列为空,不存储,大大节约空间
⑤hbase不支持条件查询以及order by等操作,记录按照row key来排序
优点
一。列动态增加,且列为空就不存储数据,节约空间
二。自动切分数据,数据存储具有水平伸缩性。
三。提高高并发的读写操作。
缺点
一。不支持条件查询,智能按照row key进行查询。
2.传统数据库
①按行存储,列固定,列的属性不能动态增加。
3.区别:
①数据类型:Hbase只有简单的字符类型,关系型数据库有着丰富的类型的存储方式。
②数据操作:hbase操作简单,插入,删除,查询,清空等,表与表之间是分离的;关系型数据库有复杂的表连接。
③存储模式:Hbase基于列,且不同列簇的文件是分离的;关系型数据库基于表结构存储。