前面已经搭建好了zookeeper主机集群,hadoop集群。 现子看来,zookeeper貌似提供了一种简便的方法来解决hadoop集群的问题,比如免密登陆,时间同步等。 但是二者都是分布式架构解决方案,所以应该不存在耦合关系! 今天继续继续环境下的hbase的安装笔记!
背景:
百度百科释义:
可见它的本质是一个数据库。 一个分布式,基于列的数据库。 这就够了。
安装环境准备:
1. 解压并配置环境变量:
2. 配置hbase环境:conf/hbase-env.sh
补充说明: 一个分布式运行的hbase依赖一个zookeeper集群。 默认情况下,hbase会管理一个zookeeper集群(hbase默认自带一个zookeeper集群。该集群随hbase的启动而启动。 HBASE_MANAGES_ZK属性可以用于单独运行zookeeper集群。 其默认值为true。
3. 配置conf/hbase-site.xml
解释说明: hbase.cluster.distributed指示hbase的运行模式。 false是单机模式,true是分布式模式。 单机模式下,hbase 与 zookeeper会运行在同一个JVM中。
hbase.rootdir是 region server的共享目录,用来持久化Hbase。 url需严格限制,并且要包含文件系统的sheme。 如这里的文件系统是: hdfs。
hbase.zookeeper.property.dataDir指明zookeeper的配置位置。 独立的zookeeper需要配置主机和端口。
4. 配置 conf/regionservers:
说明: 这里列出希望运行的全部:Hbase Region server。 它们会随着server的启动而启动,停止而停止。
5. 将 hadoop 配置文件拷入 hbase的conf目录:
6. 分发至其它虚拟机并配置环境变量。
7. 在配置 hbase.master所在的主机运行hbase。 (保证hadoop和 zookeeper已经开启)。
访问hbase主端的hbase web界面: http://ip:16010/master-status,即可查看到相关信息。
进入hbase交互界面:
通过status 与 version可以查看到相关的信息。
补充资料: