HBASE介绍
HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。
HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。
Pig和Hive还为HBase提供了高层语言支持,使得在HBase上进行数据统计处理变的非常简单。 Sqoop则为HBase提供了方便的RDBMS数据导入功能,使得传统数据库数据向HBase中迁移变的非常方便。
1. HBASE安装
(1) 三种模式:单机模式(Standalone)、伪分布模式(Pseudo-Distributed)、完全分布式模式(Fully Distributed);
(2) JAVA 版本的选择:
HBase Version |
JDK 6 |
JDK 7 |
JDK 8 |
---|---|---|---|
1.2 |
Not Supported |
yes |
yes |
1.1 |
Not Supported |
yes |
Running with JDK 8 will work but is not well tested. |
1.0 |
Not Supported |
yes |
Running with JDK 8 will work but is not well tested. |
0.98 |
yes |
yes |
Running with JDK 8 works but is not well tested. Building with JDK 8 would require removal of the deprecated remove()method of the PoolMap class and is under consideration. SeeHBASE-7608for more information about JDK 8 support. |