Zookeeper自探
自己的话:每天都要保持前进,我势必要有强劲的实力再跟全新的自己问好。
多认识更加优秀的人,你会讨厌现在的自己。
Zookeeper安装及配置
一、分布式安装部署
1.集群规划
在 hadoop1、hadoop2 和 hadoop3 三个节点上部署 Zookeeper
2.安装前准备
(1)安装 Jdk
(2)拷贝 Zookeeper 安装包到 Linux 系统下
(3)解压到指定目录
[hadoop1 software]$ tar -zxvf zookeeper-3.4.10.tar.gz -C /opt/module/
3.配置服务器编号
(1)在/opt/module/zookeeper-3.4.10/这个目录下创建 zkData
[hadoop1 zookeeper-3.4.10]$ mkdir zkData
(2)在/opt/module/zookeeper-3.4.10/zkData 目录下创建一个 myid 的文件
[hadoop1 zkData]$ touch myid
添加 myid 文件,注意一定要在 linux 里面创建,在 notepad++里面很可能乱码
(3)编辑 myid 文件
[hadoop1 zkData]$ vi myid
在文件中添加与 server 对应的编号:
1
4.配置 zoo.cfg 文件
(1)重命名/opt/module/zookeeper-3.4.10/conf 这个目录下的 zoo_sample.cfg 为 zoo.cfg
[atguigu@hadoop102 conf]$ mv zoo_sample.cfg zoo.cfg
(2)打开 zoo.cfg 文件
[hadoop102 conf]$ vim zoo.cfg
修改数据存储路径配置
dataDir=/opt/module/zookeeper-3.4.10/zkData
打开倒数第一、第三行autopurge的注释
增加如下配置:
#######################cluster##########################
server.1=hadoop1:2888:3888
server.2=hadoop2:2888:3888
server.3=hadoop3:2888:3888
(3)拷贝配置好的 zookeeper 到其他机器上
[hadoop1 module]# scp -r zookeeper-3.4.14/ hadoop2:$PWD
[hadoop1 module]# scp -r zookeeper-3.4.14/ hadoop3:$PWD
并分别在 hadoop2、hadoop3 上修改 myid 文件中内容为2、3
5.集群操作
(1)分别启动 Zookeeper
[hadoop1 zookeeper-3.4.10]$ bin/zkServer.sh start
[hadoop2 zookeeper-3.4.10]$ bin/zkServer.sh start
[hadoop3 zookeeper-3.4.10]$ bin/zkServer.sh start
(2)查看状态
[hadoop1 zookeeper-3.4.10]$ bin/zkServer.sh status
JMX enabled by default
Using config: /opt/module/zookeeper-
3.4.10/bin/../conf/zoo.cfg
Mode: follower
[hadoop2 zookeeper-3.4.10]$ bin/zkServer.sh status
JMX enabled by default
Using config: /opt/module/zookeeper-
3.4.10/bin/../conf/zoo.cfg
Mode: leader
[hadoop3 zookeeper-3.4.5]$ bin/zkServer.sh status
JMX enabled by default
Using config: /opt/module/zookeeper-
3.4.10/bin/../conf/zoo.cfg
Mode: follower
二、配置参数解读
Zookeeper中的配置文件zoo.cfg中参数含义解读如下:
1. tickTime =2000:通信心跳数Zookeeper 服务器与客户端心跳时间,单位毫秒
Zookeeper使用的基本时间,服务器之间或客户端与服务器之间维持心跳的时间间隔,也就是每个tickTime时间就会发送一个心跳,时间单位为毫秒。
它用于心跳机制,并且设置最小的session超时时间为两倍心跳时间。(session的最小超
时时间是2*tickTime)
2. initLimit =10:LF 初始通信时限
集群中的Follower跟随者服务器与Leader领导者服务器之间初始连接时能容忍的最多心跳数(tickTime的数量),用它来限定集群中的Zookeeper服务器连接到Leader的时限。
3. syncLimit =5:LF 同步通信时限
集群中Leader与Follower之间的最大响应时间单位,假如响应超过syncLimit * tickTime,Leader认为Follwer死掉,从服务器列表中删除Follwer。
4. dataDir:数据文件目录+数据持久化路径
主要用于保存 Zookeeper 中的数据。
5. clientPort =2181:客户端连接端口
监听客户端连接的端口。
6. server.A=B:C:D
- A 是一个数字,表示这个是第几号服务器;
集群模式下配置一个文件 myid,这个文件在 dataDir 目录下,这个文件里面有一个数据就是 A 的值,Zookeeper 启动时读取此文件,拿到里面的数据与 zoo.cfg 里面的配置信息比较从而判断到底是哪个server。 - B 是这个服务器的地址;
- C 是这个服务器 Follower 与集群中的 Leader 服务器交换信息的端口;
- D 是万一集群中的 Leader 服务器挂了,需要一个端口来重新进行选举,选出一个新的Leader,而这个端口就是用来执行选举时服务器相互通信的端口。