首先有一个搭建好的伪分布式
1.下载安装zookeeper
2.创建一个文件夹
--------此步骤的目的是为了能够在构建将来的Hbase托管状态下方便建立物理文件
3.修改zoo.cfg
4.配置环境变量
5.在hadoop下创建文件夹
6.测试效果
- start-all.sh
确定Hadoop能正常启动
下载安装zookeeper
下载后拖入Linux文件夹
- tar -zxvf zookeeper-3.4.9.tar.gz
进入所在路径后解压zookeeper
创建一个文件夹
- mkdir /usr/soft/hbase
创建一个文件夹下面会用到
zoo.cfg
- cd /usr/soft/zookeeper-3.4.9/conf/
- cp zoo_sample.cfg zoo.cfg
拷贝模版 - vi zoo.cfg
修改拷贝出的文件
(前者是心跳端口)
将来会配置好多server.~(完全分布式每台机器都有一个zk,和节点一样,在类似workers里面声明),现在是伪分布就一台机器,所以只写一个
默认情况下,zookeeper的事务日志和数据快照都会保存在 dataDir的 目录下
hbase的hbase-site.xml文件的hbase.zookeeper.property.dataDir值务必要和dataDir设置的一样
不然hbase的配置会覆盖掉zoo.cfg里的默认配置
快照存储路径
快照的作用主要是能够进行在线数据备份与恢复当存储,设备发生应用故障或者文件损坏时可以进行快速的数据恢复,将数据恢复某个可用的时间点的状态。快照的另一个作用是为存储用户提供了另外一个数据访问通道,当原数据进行在线应用处理时,用户可以访问快照数据,还可以利用快照进行测试等工作。所有存储系统,不论高中低端,只要应用于在线系统,那么快照就成为一个不可或缺的功能。
配置环境变量
- vi /etc/profile
配置zk环境变量
export ZOOKEEPER_HOME=/usr/soft/zookeeper-3.4.9/
:$ZOOKEEPER_HOME/bin
- source /etc/profile
激活环境变量
在hadoop下创建文件夹
- hadoop fs -mkdir -p /hbase
测试效果并为HBase创建根目录文件夹/hbase(后面装hbase的时候要用到) - hadoop fs -lsr /
查看(递归)所有目录下的文件夹;(/ 根目录、r 递归、ls 查看路径下文件)
测试效果
- zkServer.sh start
启动zk服务 - zkCli.sh
启动客户端
回车也可以 - create /hbase myhbase
在zookeeper下创建根目录文件夹(myhbase是起的别名,可以不写) - ls /
查看根目录
成功!
最后在配置一下无秘登陆
所有节点都在一台机器上,登录自己的时候也是要密码的;
- quit
登出 - jps
查看进程
如果除了那个应该出现的进程还多了一个ZookeeperMain进程也没关系,重启虚拟机后就会消失;
- zkServer.sh stop
暂停运行zk - stop-all.sh
暂停运行hadoop - ssh IP地址
配置过的还没失效,就不配了;
端口:
2x:
与程序:9000
与网页:50070
3x:
与程序:9820
与网页:9870