HBase中有三个主要组件:1.客户端库,2.一台主服务器(HMaster),3.多台region服务器.
HBase可以动态增加或移除region服务器,以适应不断变化的负载.
主服务器主要负责利用Apache ZooKeeper为region服务器分配region.
重点:
ZooKeeper是一个关键组成部分,没有它HBase就无法运作.
事前准备
HBase的配置需要JDK,另外HDFS的配置方法可以参考
Hadoop单机模式与伪分布式(CentOS7)
首先,下载HBase
解压下载的tar包
tar xzf hbase-2.2.2-bin.tar.gz -C /TO/SOME-PATH/YOU-WANT
创建一个符号链接,方便访问,或多版本存在的情况下进行指定.
ln -s hbase-2.2.2 hbase
注:至于HBase的配置,各种资料,各种版本,各不相同,所以在这里说明一下,同配置Hadoop一样,这类软件的包里(一般是doc或者etc等目录下)一般都会有index.html文件,可以用浏览器打开,里面都是官方的文档,网上版本再花,官方的总该最权威~
如果懒得找那就直接点这里吧官方配置页面
配置环境变量,添加如下内容
vim ~/.bash_profile
....
export HBASE_HOME=/opt/tools/hbase
PATH=$PATH:$HBASE_HOME/bin
export PATH
# 最后别忘了重读配置
source ~/.bash_profile
本地模式
打开hbase-site.xml,并配置如下内容:
·hbase.rootdir为RegionServer的共享目录,是用来持久化HBase的.
·默认为file:///tmp/hbase-${user.name}/hbase
有些文件系统启动时会清空/tmp文件夹,所以如果不修改,有被清空的风险,这里还是强烈推荐修改,
毕竟是用来持久化的,目录配置好以后启动时会自动创建,无需提前mkdir.
.hbase.zookeeper.property.dataDir:
这个属性其实是和zookeeper的zoo.cfg文件中dataDir属性同样的效果,是zookeeper的数据目录,
存储快照信息等,虽然不配置这个属性仍旧可以在本地模式正常运行hbase.这里本地模式对这个属性不做
过多讨论,下面伪分布式再进一步说明.
<configuration>