Zookeeper的环境配置
HBase做集群,所以就需要zookeeper了
将下载下来的Zookeeper 的配置文件进行解压
tar -xvf zookeeper-3.4.6.tar.gz
然后移动到/app/hadoop/目录下(根据自身情况选择)
mv zookeeper-3.4.10 /app/hadoop
创建目录
mkdir /app/hadoop/zookeeper-3.4.10/data
mkdir /app/hadoop/zookeeper-3.4.10/dataLog
进入data目录创建myid文件 将hadoop1、hadoop2、hadoop3的myid文件内容改为1,2,3
cd /app/hadoop/zookeeper-3.4.10/data
touch myid
vim myid
1
这个myid 不同服务器不同 1,2,3
和配置文件中一一对应
conf 目录下新建zoo.cfg
cd /app/hadoop/zookeeper-3.4.10/conf
mv zoo_sample.cfg zoo.cfg
vim zoo.cfg
添加如下配置
dataDir=/app/hadoop/zookeeper-3.4.6/data
dataLogDir=/app/hadoop/zookeeper-3.4.6/dataLog
server.1=hadoop1:2888:3888
server.2=hadoop2:2888:3888
server.3=hadoop3:2888:3888
这里server.1 的1是和上面的myid对应
注:因为之前1服务器始终启动不成功,修改成4 正常启动
报错Have smaller server identifier, so dropping the connection: (2, 1)
说明:client port,顾名思义,就是客户端连接zookeeper服务的端口。这是一个TCP port。dataLogDir里是放到的顺序日志(WAL)。而dataDir里放的是内存数据结构的snapshot,便于快速恢复。为了达到性能最大化,一般建议把dataDir和dataLogDir分到不同的磁盘上,这样就可以充分利用磁盘顺序写的特性。dataDir和dataLogDir需要自己创建,目录可以自己制定,对应即可。server.1中的这个1需要和master这个机器上的dataDir目录中的myid文件中的数值对应。server.2中的这个2需要和slave1这个机器上的dataDir目录中的myid文件中的数值对应。server.3中的这个3需要和slave2这个机器上的dataDir目录中的myid文件中的数值对应。当然,数值你可以随便用,只要对应即可。2888和3888的端口号也可以随便用,因为在不同机器上,用成一样也无所谓。
1.tickTime:CS通信心跳数
Zookeeper 服务器之间或客户端与服务器之间维持心跳的时间间隔,也就是每个 tickTime 时间就会发送一个心跳。tickTime以毫秒为单位。
tickTime=2000
2.initLimit:LF初始通信时限
集群中的follower服务器(F)与leader服务器(L)之间初始连接时能容忍的最多心跳数(tickTime的数量)。
initLimit=10
3.syncLimit:LF同步通信时限
集群中的follower服务器与leader服务器之间请求和应答之间能容忍的最多心跳数(tickTime的数量)。
syncLimit=5
依旧将zookeeper传输到其他的机器上,记得更改 /opt/zookeeper/data 下的myid,与配置文件中相同。
输入:
scp -r /app/hadoop/zoo/app/hadoop/zookeeper-3.4.6 root@slave1:/app/hadoop
启动、查看状态
zkServer.sh start
zkServer.sh status