准备工作
HBase需要基于Hadoop以及Zookeeper进行搭建
故需先准备Hadoop以及Zookeeper环境
1、启动hadoop
HBase需要将数据存储在HDFS之上,对YARN的依赖不高
-
启动命令
start-all.sh
-
访问WEB页面进行验证
-
HDFS:http://master:50070
-
YARN:http://master:8088
-
2、启动zookeeper
-
启动命令
zookeeper是基于去中心化架构
如果是分布式环境则需要在每一台机器中都进行启动
zkServer.sh start
-
查看状态
zkServer.sh status
搭建HBase
注:可以使用yum install lrzsz的方式下载方法,确保今后可以直接拖动安装包到文件夹
1、上传解压配置并境变量
tar -zxvf hbase-1.4.6-bin.tar.gz -C /usr/local/soft # 修改环境变量,将HBase解压路径的bin目录配置到环境变量中 vim /etc/profile # HBSE_HOME export HBASE_HOME=/usr/local/soft/hbase-1.4.6 export PATH=$PATH:$HBASE_HOME/bin # 保存退出之后,重新加载环境变量 source /etc/profile
2、修改hbase-env.sh文件
# 增加java配置 export JAVA_HOME=/usr/local/soft/jdk1.8.0_171 # 关闭默认zk配置 export HBASE_MANAGES_ZK=false
3、修改hbase-site.xml文件
<property> <name>hbase.rootdir</name> <value>hdfs://master:9000/hbase</value> </property> <property> <name>hbase.cluster.distributed</name> <value>true</value> </property> <property> <name>hbase.zookeeper.quorum</name> <value>node1,node2,master</value> </property>
4、修改 regionservers 文件
如果是伪分布式版本,增加master即可
# 增加 node1 node2
5、同步到所有节点
如果是伪分布式不需要同步
scp -r hbase-1.4.6/ node1:`pwd` scp -r hbase-1.4.6/ node2:`pwd`
6、启动/停止HBase集群
需要在master上执行
# 启动HBase start-hbase.sh # 停止HBase stop-hbase.sh
7、验证HBase
-
访问HBase的WEB UI:http://master:16010
-
8、查看日志
-
HBase日志文件所在的目录:
/usr/local/soft/hbase-1.4.6/logs
9、简单使用
-
通过
hbase shell
进入到hbase的命令行 -
创建表
create 'test','info'
-
插入数据
put 'test','000','info:name','zhaosi' put 'test','001','info:name','zhangsan' put 'test','002','info:name','lisi' put 'test','003','info:name','wangwu' put 'test','0011','info:name','wangwu2'
-
查询数据
get 'test','001'
10、重置hbase
hbase 搭建失败了 不知道问题出在哪里
-
1、关闭hbase集群
-
stop-hbase.sh
-
杀死进程
-
-
2、删除hdfs数据:
hdfs dfs -rmr /hbase
-
3、删除元数据 zk
-
使用zk客户端:
zkCli.sh
-
删除/hbase节点:
rmr /hbase
-
-
4、检查配置文件是否正确
如果配置文件有改动,则需同步到其他节点
-
5、重新启动hbase:
start-hbase.sh