Overview
HBase是Hadoop数据库,是一个分布式,可扩展的大数据存储。当您需要对大数据进行随机、实时读/写访问时,请使用HBase。该项目的目标是托管非常大的表 - 数十亿行X百万列 - 在商品硬件集群上。HBase是一个开源的,分布式的,版本化的非关系数据库,模仿Google的Bigtable:结构化数据分布式存储系统。正如Bigtable利用Google文件系统提供的分布式数据存储一样,HBase在Hadoop和HDFS之上提供类似Bigtable的功能。
HBase****适用于海量数据的准实时查询。
**HBase****的特点:**海量数据,列式存储,多版本,稀疏性,扩展新(底层基于HDFS),高可靠性,高性能(底层的LSM数据结构和Rowkey有序排列等架构上的独特设计,使得Hbase具有非常高的写入性能,Region切分、主键索引和缓存机制à高性能读性能)
Hbase****在hadoop2.X中的作用
Hbase是基于HDFS的一个数据存储工具,如图所示:
HBase****的架构体系:
从物理结构上讲,HBase由三种类型的服务器构成主从式架构。Region Servers为数据的读取和写入提供服务。当访问数据时&#