ZooKeeper入门及安装

最新推荐文章于 2023-04-12 22:52:40 发布

爆发的~小宇宙

最新推荐文章于 2023-04-12 22:52:40 发布

阅读量231

点赞数

分类专栏： Zookeeper 文章标签： Zookeeper 入门 Zookeeper分布式安装 Zookeeper本地安装

本文链接：https://blog.csdn.net/yu0_zhang0/article/details/88364595

版权

Zookeeper 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

1 概述

官网地址
Zookeeper是一个开源的分布式的，是Hadoop的分布式协调服务。

Zookeeper从设计模式角度来理解：是一个基于观察者模式设计的分布式服务管理框架，它负责存储和管理大家都关心的数据，然后接受观察者的注册，一旦这些数据的状态发生变化，Zookeeper就将负责通知已经在Zookeeper上注册的那些观察者做出相应的反应，从而实现集群中类似Master/Slave管理模式。

2 ZK的作用

对于分布式应用中，写分布式主要苦难在于会出现“部分失败”，一条消息在节点之间传输，如果网络错误，发送者无法知道接收者是否收到消息，又或者接收者进程已经kill了，那么发送者会重新连接接收者，发出消息，这种情况就是部分失败。

部分失败也是分布四系统的固有特征，而ZK可以在分布式应用中对部分失败进行处理，但是它并不能避免部分失败，而是可以进行处理。

3 ZK的特点

ZK简单性：ZK的核心是一个精简的文件系统，提供了一些简单操作，排序和通知。
ZK丰富性：ZK可以做分布式队列、分布式锁和一组节点中的”领导者选取“。
ZK高可用性：ZK运行在一组机器上，可以实现高可用，避免系统出现单点故障。
ZK采用松耦合的交互式方式：ZK可以被用于实现”数据汇聚“（rendezvous）机制让进程在不了解其他进程是可以进行信息交互，参与方甚至可以不必同时存在，一个进程在ZK中留下一条信息，在该进程结束后，另外一个进程可以读取这条消息。

4 常见的应用场景

总的来说ZK提供的服务包括：分布式消息同步和协调机制、服务器节点动态上下线、统一配置管理、负载均衡、集群管理等。

数据发布与订阅

当应用启动时，主动到ZK上获取配置信息并注册Watcher监听，配置管理员变更ZK配置节点的内容，ZK推送变更到应用出发Watcher回调函数，应用会根据逻辑主动获取新的配置信息，更改自身逻辑。
适用于配置信息多设备共享，会发生动态变化。
负载均衡

Register负责域名的注册，服务器启动后将域名信息通过Register注册到ZK相应域名服务器下。
Dispatcher负责域名的解析，可以实现负载均衡。
Sacanner通过定时监测服务器状态，动态改变节点信息地址。
Monltor负责收集服务器信息与状态监控。
Controller提供后台Console，提供配置管理功能。

集群管理

ZK可以实现集群的管理，手机每台机器的运行状态，对集群进行上下线操作，分布式的任务汇报等。

5 本地模式安装部署

下载地址：http://mirrors.shu.edu.cn/apache/zookeeper/zookeeper-3.4.13/zookeeper-3.4.13.tar.gz
安装前准备：
（1）安装jdk
（2）通过filezilla工具拷贝zookeeper到到linux系统下
（3）修改tar包权限
chmod u+x zookeeper-3.4.13.tar.gz
（4）解压到指定目录
tar -zxvf zookeeper-3.4.13.tar.gz -C /opt/sofeware/
配置修改

将/opt/module/zookeeper-3.4.13/conf这个路径下的zoo_sample.cfg修改为zoo.cfg；
进入zoo.cfg文件：vim zoo.cfg
修改dataDir路径为
dataDir=/opt/module/zookeeper-3.4.13/data/zkData
在/opt/module/zookeeper-3.4.13/这个目录上创建data/zkData文件夹
mkdir -p data/zkData

操作zookeeper
（1）启动zookeeper
bin/zkServer.sh start
（2）查看进程是否启动

[hadoop@hadoop001 zookeeper-3.4.13]$ jps
4020 Jps
4001 QuorumPeerMain

（3）查看状态：

[hadoop@hadoop001 zookeeper-3.4.13]$ bin/zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /opt/module/zookeeper-3.4.13/bin/../conf/zoo.cfg
Mode: standalone

（4）启动客户端：

[hadoop@hadoop001 zookeeper-3.4.13]$ bin/zkCli.sh

（5）退出客户端：

[zk: localhost:2181(CONNECTED) 0] quit

（6）停止zookeeper

[hadoop@hadoop001 zookeeper-3.4.13]$ bin/zkServer.sh stop

6 配置参数解读

zoo.cfg 文件中参数含义

tickTime ：通信心跳数，Zookeeper服务器心跳时间，单位毫秒
Zookeeper使用的基本时间，服务器之间或客户端与服务器之间维持心跳的时间间隔，也就是每个tickTime时间就会发送一个心跳，时间单位为毫秒。
它用于心跳机制，并且设置最小的session超时时间为两倍心跳时间。(session的最小超时时间是2*tickTime)
initLimit：LF初始通信时限
集群中的follower跟随者服务器(F)与leader领导者服务器(L)之间初始连接时能容忍的最多心跳数（tickTime的数量），用它来限定集群中的Zookeeper服务器连接到Leader的时限。
投票选举新leader的初始化时间
Follower在启动过程中，会从Leader同步所有最新数据，然后确定自己能够对外服务的起始状态。
Leader允许F在initLimit时间内完成这个工作。
syncLimit：LF同步通信时限
集群中Leader与Follower之间的最大响应时间单位，假如响应超过syncLimit * tickTime，
Leader认为Follwer死掉，从服务器列表中删除Follwer。
在运行过程中，Leader负责与ZK集群中所有机器进行通信，例如通过一些心跳检测机制，来检测机器的存活状态。
如果L发出心跳包在syncLimit之后，还没有从F那收到响应，那么就认为这个F已经不在线了。
dataDir：数据文件目录+数据持久化路径
保存内存数据库快照信息的位置，如果没有其他说明，更新的事务日志也保存到数据库。
clientPort：客户端连接端口
监听客户端连接的端口

7 分布式安装部署

集群规划
在hadoop001、hadoop002和hadoop003三个节点上部署Zookeeper。
解压安装

（1）解压zookeeper安装包到/opt/software/目录下
[hadoop@hadoop001 software]$ tar -zxvf zookeeper-3.4.13.tar.gz -C /opt/software/

（2）在/opt/software/zookeeper-3.4.13/这个目录下创建data/zkData
mkdir -p data/zkData

（3）重命名/opt/software/zookeeper-3.4.13/conf这个目录下的zoo_sample.cfg为zoo.cfg
mv zoo_sample.cfg zoo.cfg
配置zoo.cfg文件
（1）具体配置
dataDir=/opt/software/zookeeper-3.4.13/data/zkData
增加如下配置

	#######################cluster##########################
server.1=hadoop001:2888:3888
server.2=hadoop002:2888:3888
server.3=hadoop003:2888:3888

（2）配置参数解读

	Server.A=B:C:D。
	A是一个数字，表示这个是第几号服务器；
	B是这个服务器的ip地址；
	C是这个服务器与集群中的Leader服务器交换信息的端口；
	D是万一集群中的Leader服务器挂了，需要一个端口来重新进行选举，选出一个新的Leader，
	而这个端口就是用来执行选举时服务器相互通信的端口。
	集群模式下配置一个文件myid，这个文件在dataDir目录下，这个文件里面有一个数据就是A的值，
	Zookeeper启动时读取此文件，拿到里面的数据与zoo.cfg里面的配置信息比较从而判断到底是哪个server。

集群操作

（1）在/opt/software/zookeeper-3.4.13/data/zkData目录下创建一个myid的文件
touch myid
添加myid文件，注意一定要在linux里面创建，在notepad++里面很可能乱码

（2）编辑myid文件
vi myid
在文件中添加与server对应的编号：如1

（3）拷贝配置好的zookeeper到其他机器上

	scp -r zookeeper-3.4.13/ root@hadoop002:/opt/software/
	scp -r zookeeper-3.4.13/ root@hadoop003:/opt/software/

并分别修改myid文件中内容为2、3

分别启动zookeeper

[hadoop@hadoop001 zookeeper-3.4.13]# bin/zkServer.sh start
[hadoop@hadoop002 zookeeper-3.4.13]# bin/zkServer.sh start
[hadoop@hadoop003 zookeeper-3.4.13]# bin/zkServer.sh start

查看状态

[hadoop@hadoop001 zookeeper-3.4.13]# bin/zkServer.sh status
JMX enabled by default
Using config: /opt/shftware/zookeeper-3.4.13/bin/../conf/zoo.cfg
Mode: follower

[hadoop@hadoop002 zookeeper-3.4.13]# bin/zkServer.sh status
JMX enabled by default
Using config: /opt/shftware/zookeeper-3.4.13/bin/../conf/zoo.cfg
Mode: leader

[hadoop@hadoop003 zookeeper-3.4.13]# bin/zkServer.sh status
JMX enabled by default
Using config: /opt/shftware/zookeeper-3.4.13/bin/../conf/zoo.cfg
Mode: follower