大数据数据库(HBase)
一、HBase概述
- 基于google Bigtable开发的开源分布式数据库。
1.1 HBase简介
- 关系数据库(RDBMS)基于关系模型建立的数据库。例如:Oracle,DB2,PostgreSQL,SQL Server,MySql,无法满足大量数据处理的需求
- HBase等非关系数据库适合用于存储大表数据(十几亿行以及数百万列),并且读写可达到实时级别
1.2 HBase与关系型数据库的区
- 数据类型:RDBMS存储结构化数据,HBase在存储数据时将各种类型的数据以字符串形式保存,在做数据处理时需要编写程序将字符串解析成不同的数据类型
- 存储模式:RDBMS基于行模式存储。非关系型数据库是基于列的存储,在用户查询时只需要返回对应的列,大大降低I/O的开销。但是做整行读取时需要多次I/O操作
- 可扩展性:RDBMS横向扩展(增加服务器数量)的扩展性较差,纵向扩展(增加单台服务器的容量和性能)的空间比较有限。HBase很方便实现存储空间和性能的扩展
1.3 HBase的地应用场景
- 海量数据
- 高吞吐率
- 在海量数据中实现高效的随机读取
- 性能可伸缩
- 能够同时处理结构化和非结构化的数据