HBase的安装也有三种模式:单机模式、伪分布模式和完全分布式模式,在这里只介绍完全分布模式。
安装前,需要先确认已正确安装Hadoop集群和Zookeeper并运行。
这里下载的是hbase-0.94.6,Hadoop集群使用的是1.0.4,
假设我们的集群环境是master,slaver1,slaver2(要注意机器别名已经在/etc/hosts下进行了配置,否则可用IP)
第一步:下载安装包,解压到安装目录,这里我们安装在/opt目录下,目录名我们命名为hbase,并将权限分配给hadoop用户(运行hadoop的账户)
sudo cp hbase-0.94.6.tar.gz/opt/
sudo tar -zxf hbase-0.94.6.tar.gz
sudo mv hbase-0.94.6 hbase
sudo chown -R hadoop:hadoop hbase
第二步:配置相关的文件
(1)配置hbase-env.sh,该文件在/opt/hbase/conf,设置以下值:
export JAVA_HOME=/usr/local/java/jdk1.6.0_27 #Java安装路径
export HBASE_MANAGES_ZK=true #由HBase负责启动和关闭Zookeeper
(2)配置hbase-site.xml,该文件位于/opt/hbase/conf
<property>
<name>hbase.master</name>
<value>master:6000</value>
</property>
<property>
<name>hbase.master.maxclockskew</name>
<value>180000</value>
</property>
<property>
<name>hbase.rootdir</name>
<value>hdfs://master:9000/hbase</value>
</property>
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
<property>
<name>hbase.zookeeper.quorum</name>
<value>master,slaver1,slaver2</value>
</property>
<property>
<name>hbase.zookeeper.property.dataDir</name>
<value>/home/${user.name}/tmp/zookeeper</value>
</property>
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
其中:
hbase.master:是指定运行HMaster的服务器及端口号;
hbase.master.maxclockskew:是用来防止HBase节点之间时间不一致造成regionserver启动失败,默认值是30000;
hbase.rootdir:指定HBase的存储目录;
hbase.cluster.distributed:设置集群处于分布式模式;
hbase.zookeeper.quorum:设置Zookeeper节点的主机名,它的值个数必须是奇数;
hbase.zookeeper.property.dataDir:设置Zookeeper的目录,默认为/tmp
dfs.replication:设置数据备份数,集群节点小于3时需要修改,默认为3。
(3)配置regionservers,该文件位于/opt/hbase/conf
设置所运行HBase的机器,此文件配置和hadoop中的slaves类似,一行指定一台机器,配置为:
master
slaver1
slaver2
(4)设置HBase环境变量
export HBASE_HOME=/opt/hbase
export PATH=$PATH:$HBASE_HOME/bin
使之生效:# source .bash_profile
第三步:运行测试
启动hadoop后,在终端输入start-hbase.sh,查看启动情况,如不报错则启动成功了。
第四步:检查
终端输入:# hbase shell
进入hbase命令界面后执行一些hbase指令,如list,如正常即代表成功
停止hbase:stop-hbase.sh