HBase是一个构建在HDFS上的分布式列存储系统,主要用于海量结构化数据存储,从逻辑上讲,HBase将数据按照表、行和列进行存储。
HDFS适合批处理场景
不支持数据随机查找
不适合增量数据处理
不支持数据更新
以上HDFS不适合、不支持的场景,HBase都支持
大数据上高并发操作,比如每秒对PB级数据进行上千次操作,并且读写访问均是非常简单的操作。
Hbase表的特点
大:一个表可以有数十亿行,上百万列;
无模式:每行都有一个可排序的主键和任意多的列,列可以根据需要动态的增加,同一张表中不同的行可以有截然不同的列;
面向列:面向列(族)的存储和权限控制,列(族)独立检索;
稀疏:对于空(null)的列,并不占用存储空间,表可以设计的非常稀疏;
数据多版本:每个单元中的数据可以有多个版本,默认情况下
大数据(五) - HBase
最新推荐文章于 2020-07-09 23:23:29 发布