Hbase教程(一) Hbase入门教程

原创 2016年06月01日 13:26:11

 

 

Hbase教程() Hbase入门教程

 


1 Hbase入门教程

HBase是一个分布式的、面向列的开源数据库,该技术来源于 FayChang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBaseHadoop之上提供了类似于Bigtable的能力。HBaseApacheHadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。


HBaseHadoop生态位置图1-1

 

 

1.1 Hbase概念术语

1、行键Row Key:主键是用来检索记录的主键,访问hbasetable中的行。

 

2、列族Column FamilyTable在水平方向有一个或者多个ColumnFamily组成,一个ColumnFamily中可以由任意多个Column组成,即ColumnFamily支持动态扩展,无需预先定义Column的数量以及类型,所有Column均以二进制格式存储,用户需要自行进行类型转换。

 

3、column:由Hbase中的列族ColumnFamily + 列的名称(cell组成列。

 

4、单元格cellHBase中通过rowcolumns确定的为一个存贮单元称为cell

 

5、版本version:每个 cell都保存着同一份数据的多个版本。版本通过时间戳来索引。

 

6、Hbase数据结构图:

 

rowkey(行键)

product

 

food(列族)

 

name(列标识符)

price(列标识符)

name

price(列标识符)

rowkey001

ThinkPad E550
cell基本单元格)

4199

orange

6.0

version(版本)

5.0

5.5

6.0

HBase数据结构图1-2

1.2 Hbase下载

Hbase是建立Hadoop基础上的数据库文件,因此Hbase是分布式的数据库。Hbase也提供了单机版的安装。

HadoopHbase版本关系表:

版本

HBase-0.94.x

HBase-0.98.x

HBase-1.0.x

HBase-1.1.x

HBase-1.2.x

Hadoop-1.0.x

X

X

X

X

X

Hadoop-1.1.x

S

NT

X

X

X

Hadoop-0.23.x

S

X

X

X

X

Hadoop-2.0.x-alpha

NT

X

X

X

X

Hadoop-2.1.0-beta

NT

X

X

X

X

Hadoop-2.2.0

NT

S

NT

NT

X

Hadoop-2.3.x

NT

S

NT

NT

X

Hadoop-2.4.x

NT

S

S

S

S

Hadoop-2.5.x

NT

S

S

S

S

Hadoop-2.6.0

X

X

X

X

X

Hadoop-2.6.1+

NT

NT

NT

NT

S

Hadoop-2.7.0

X

X

X

X

X

Hadoop-2.7.1+

NT

NT

NT

NT

S

 

HadoopJDK版本关系表:

Hbase版本

JDK 6

JDK 7

JDK 8

1.2

Not Supported

yes

yes

1.1

Not Supported

yes

Not Supported

1

Not Supported

yes

Not Supported

0.98

yes

yes

Not Supported

0.94

yes

yes

N/A


-  S = supported and tested,支持

-  X = not supported,不支持

-  NT = not tested enough.可以运行但测试不充分


1.3 Hbase单机部署


Hadoop教程()Hadoop分布式集群部署安装》安装的是Hadoop-2.7.1版本,在此需要下载Hbase-1.2.x版本:

下载地址:http://mirror.bit.edu.cn/apache/hbase/1.2.1/hbase-1.2.1-bin.tar.gz

1、配置本机hosts

      127.0.0.1 localhost

      127.0.0.1 hbase-domain hbase


2、下载hbase-1.2.1-bin.tar到目录位置:/usr/local/software/

执行命令:

mkdir /usr/local/software

cd /usr/local/software

wget http://mirror.bit.edu.cn/apache/hbase/1.2.1/hbase-1.2.1-bin.tar.gz

 

3、解压Hbase

执行命令:tar -zxvf hbase-1.2.1-bin.tar.gz

重命名:mv hbase-1.2.1  hbase_1.2.1


 

4、配置环境变量

export JAVA_HOME=/usr/local/software/jdk1.8.0_66

export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export HBASE_HOME=/usr/local/software/hbase_1.2.1

export PATH=.:$JAVA_HOME/bin:$HBASE_HOME/bin:$PATH


5、修改hbase-env.sh配置文件

执行命令:

vi /usr/local/software/hbase_1.2.1/conf/hbase-env.sh

     修改内容:

         export JAVA_HOME=/usr/local/software/jdk1.8.0_66

 

6、修改hbase-site.xml配置文件

执行命令:vi/usr/local/software/hbase_1.2.1/conf/hbase-site.xml

	<configuration>
	     <property>
	        <name>hbase.rootdir</name>
	        <value>file:///home/hbase</value>
	     </property>
	</configuration>

7、启动Hbase

执行命令:/usr/local/software/hbase_1.2.1/bin/start-hbase.sh


8、验证启动

执行命令:jps,查看运行的Hbase进程


 

1.4 学习Hbase推荐书籍:

1. Hbase权威指南》

2. Hbase实战》

3. Hbase企业应用开发实站》

4. Learning HBase(中文版)》

5. HBase管理指南》

 


                --以上为《Hbase教程(一) Hbase入门教程》,如有不当之处请指出,我后续逐步完善更正,大家共同提高。谢谢大家对我的关注。

                                                                                                                                                                                      ——厚积薄发(yuanxw)


版权声明:本文为博主原创文章,未经博主允许不得转载。

Apache HBase 入门教程

Apache HBase 是一个分布式的、面向列的开源数据库。正如上一节所提到的,该技术来源于 Google 的 Bigtable。就像 Bigtable 利用了 GFS 所提供的分布式数据存储一样,...

HBase基本数据操作详解【完整版,绝对精品】

转载 http://blog.csdn.net/u010967382/article/details/37878701 概述 对于建表,和RDBMS类似,HBase也有namespace的概念...

hbase学习教程(一):hbase的概述和hbase架构及基本组件

一、hbase的概述概述HBase是一个构建在HDFS上的分布式列存储系统; HBase是基于Google BigTable模型开发的,典型的key/value系统; HBase是Apache H...

HBASE从入门到精通

HBASE从入门到精通   Hadoop学习教程: http://ihadoop.taobao.com http://item.taobao.com/item.htm?spm=686.1000...

【HBase基础教程】3、HBase Shell DDL操作

DDL(Data Definition Language)是数据库模式定义语言,是用于描述数据库中要存储的现实世界实体的语言,本节内容将执行关于Hbase的DDL操作,包括:数据库表的建立、查看所有表...

Alex 的 Hadoop 菜鸟教程: 第19课 华丽的控制台 HUE 安装以及使用教程

Hadoop也有web管理控制台,而且还很华丽,它的名字叫HUE。通过HUE可以管理Hadoop常见的组件。下面用一幅图说明HUE能管理哪些组件。除了Oozie,LDAP SAML和Solr以外,前面...

Hbase教程(二) Hbase数据库Shell命令

Hbase是分布式是一个分布式的、面向列的开源数据库,Hbase也提供了Shell命令对数据库增、删、改、查的权限的基本操作,比如数据库的创建、修改、删除、修改操作等,数据的插入、删除、修改等。...
  • yuan_xw
  • yuan_xw
  • 2016年06月02日 00:16
  • 3938

Hbase原理、基本概念、基本架构

概述 HBase是一个构建在HDFS上的分布式列存储系统; HBase是基于Google BigTable模型开发的,典型的key/value系统; HBase是Apache Hadoop生态系统...

大数据学习——HBase 入门

HBase学习环境shiyanlou 《HBase介绍、安装与应用案例》 - CentOS6.6 64位 - JDK 1.7.0_55 64位 - Hadoop 1.1.2Hbase 介绍...
  • xundh
  • xundh
  • 2017年04月19日 22:16
  • 564

HBase 5分钟 快速入门

HBase 5分钟 快速入门
  • myloon
  • myloon
  • 2011年03月27日 19:17
  • 6057
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Hbase教程(一) Hbase入门教程
举报原因:
原因补充:

(最多只允许输入30个字)