HBase有什么优点和缺点

HBase是一种建立在HDFS上的分布式NoSQL数据库系统,具有高可靠性、高性能、列存储等特点,适用于大规模数据存储与实时读写。本文介绍了HBase的主要优点,如支持海量数据存储、面向列的存储方式、稀疏数据处理能力、多版本数据支持、统一的数据类型、无模式的灵活设计、高可靠性和高性能,并探讨了其局限性,包括对SQL语句的支持缺失和单一RowKey带来的查询限制。

HBase:

HBase是一个建立在HDFS之上的分布式,提供高可靠性,高性能,列存储,可伸缩,实时读写NoSQL的数据库系统。

HBase的优点: 

(1)大:一个表可以有上十亿行,上百万列。

(2)面向列:面向列(簇)的存储和权限控制,列(簇)独立检索。

(3)稀疏:对于为空(null)的列并不占用内存空间,因此,表可以设计的非常稀疏。

(4)多版本:每个单元中的数据可以有多个版本,默认情况下版本号自动分配,是单元格插入时的时间戳。

(5)数据类型单一:HBase中数据类型都是字符串。

(6)无模式:每一行都有一个可以排序的rowKey和任意多的列,列可以根据需要动态增加,同一张表的不同行可以有截然不同的列。

(7)高可靠性:WAL预写式日志(write-ahead log)机制保证了数据写入时不会因集群异常而导致写入数据丢失,Replication机制保证了在集群出现严重的问题时,数据不会发生丢失或损坏。而且Hbase底层使用HDFS,HDFS本身也有备份。

(8)高性能:底层的LSM数据结构和Rowkey有序排列等架构上的独特设计,使得Hbase具有非常高的写入性能。region切分,主键索引和缓存机制使得Hbase在海量数据下具备一定的随机读取性能,该性能针对Rowkey的查询能到达到毫秒级别。

HBase的缺点:

(1):虽然HBase是一个非关系型数据库但是它不支持SQL语句。

(2):单一RowKey固有的局限性决定了它不可能有效地支持多条件查询

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值