1、通过命令tar xvf hbase-0.90.4.tar.gz解压到当前文件夹
2、 修改HBase的配置文件:
编辑所有机器上的hbase安装目录conf目录下的hbase-site.xml、hbase-default.xml、hbase-env.sh几个文件,当然可以先配置主机的然后通过scp命令拷贝到虚拟机上,但是可能要做相应的路径修改。
a. Hbase-site.xml:
编辑这个文件要注意hbase.rootdir参数,这个参数的前面部分必须与你的hadoop集群里的core-site.xml文件里fs.default.name保持一致才可以。在就是hbase该项不识别机器的IP,只能使用机器的hostname才可以。
另外Hbase.zookeeper.quorum个数必须为奇数。
<configuration>
<property>
<name>hbase.rootdir</name>
<value>hdfs://a004:9000/hbase</value>
</property>
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
<property>
<name>hbase.master</name>
<value>a004</value>
</property>
#这两个选项的value值可以选择使用ip地址代替hostname,效果一样
<property>
<name>hbase.zookeeper.quorum</name>
<value>a004,p001,p002</value>
</property>
#下面两个可以设置也可以不设置,都是有默认值的
<property>
<name>zookeeper.session.timeout</name>
<value>60000</value>
</property>
<property>
<name>hbase.zookeeper.property.clientPort</name>
<value>2181</value>
</property>
</configuration>
b. Hbase-default.xml:
这个配置文件只需修改前面的hbase.rootdir和hbase.cluster.distributed这两项,之前的版本这个文件是在conf目录下,但是在0.90.4版本中是在两个文件夹中存在,docs和src/main/resources中,不设置也应该没有问题。
<property>
<name>hbase.rootdir</name>
<value>hdfs://a004:9000/hbase</value>
</property>
<property>
<name>hbase.master.port</name>
<value>60000</value>
</property>
<property>
<name>hbase.cluster.distributed</name>
<value>false</value>
</property>
c. Hbase-env.sh:
添加如下环境变量
export JAVA_HOME=/home/username/jdk1.6.0_24
export HBASE_HOME=/home/username/hbase-0.90.4
export PATH=$PATH:/home/username/hbase-0.20.6/bin
export HBASE_MANAGES_ZK=true
export HADOOP_HOME=/home/username/hadoop-0.20.2
d. 修改regionservers文件:
将所有的DataNode节点的主机名称加进去就可以了
a004
p001
p002
3、把/home/username/hadoop/conf/hdfs-site.xml文件拷贝至hbase的conf文件夹下
4、删除/hbase/lib/hadoop-core-0.20-append-r1056497.jar
拷贝/hadoop-0.20.2-core.jar到/hbase-0.90.2/lib/
#这个jar包没有替换好像也能启动Hbase,具体可能要在操作中才会知道替换是否必要。
5、最后,把配置好的hbase,拷贝到其它节点 scp
6. 安装Zookeeper(详细可见zookeeper文档)
在所有机器上安装Zookeeper
tar zxvf zookeeper-3.3.3.tar.gz
添加环境变量
export ZOOKEEPER_INSTALL=/home/username/zookeeper-3.3.3
export PATH=$PATH:$ZOOKEEPER_INSTALL/bin
然后修改zookeeper安装目录下的conf下的zoo_sample.cfg,将其重命名为zoo.cfg。
配置集群使用需要在文件中加上:
initLimit=10
syncLimit=5
在文件最后将所有的zookeeper服务添加上,如下:
server.1=a004:2888:3888
server.2=p001:2888:3888
server.3=p002:2888:3888
验证安装:
1.首先启动hadoop集群:jps查看namenode和datanode的服务是否正常启动
2.启动hbase:同样通过jps查看,注意在master(即HMater)节点上有HMaster和HRegionServer、HQuorumPeer三个服务项(后两者是因为将namenode也作为了一个HRegionServers),在datanode(即HRegionServer)中查看需要启动的是HQuorumPeer和HRegionServer
3.整个集群正常启动后,我们可以通过hbase 的命令行管理界面看看是否正常
hbase shell 这个命令是进入命令行管理模式,然后可以通过list可以列举你当前数据库的名称,如果失败会有java错误抛出,
我们也可以通过WEB页面来管理查看HBase数据库 http://localhost:60010/master.jsp