【一篇入魂】Zookeeper入门看这篇就够了

最新推荐文章于 2024-08-04 15:10:11 发布

CAFEBABE00

最新推荐文章于 2024-08-04 15:10:11 发布

阅读量2.5k

点赞数 1

分类专栏：一篇入魂分布式文章标签： zookeeper 分布式集群

本文链接：https://blog.csdn.net/jiaodaguan/article/details/103473654

版权

1.ZooKeeper

1.1. ZooKeeper 概述

Zookeeper 是一个分布式协调服务的开源框架。主要用来解决分布式集群中应用系统的一致性问题，例如怎样避免同时操作同一数据造成脏读的问题。
ZooKeeper 本质上是一个分布式的小文件存储系统。提供基于类似于文件系统的目录树方式的数据存储，并且可以对树中的节点进行有效管理。从而用来维护和监控你存储的数据的状态变化。通过监控这些数据状态的变化，从而可以达到基于数据的集群管理。诸如:统一命名服务、分布式配置管理、分布式消息队列、分布式锁、分布式协调等功能。

1.2. ZooKeeper 特性

全局数据一致、可靠性、顺序性、数据更新原子性、实时性

1.3. ZooKeeper 集群角色

在这里插入图片描述

Leader：事务请求(写操作)的唯一调度和处理者，集群内部各个服务器的调度者。
Follower: 处理客户端非事务(读操作)请求，转发事务请求给 Leader; 参与集群 Leader 选举投票。
此外，针对访问量比较大的 zookeeper 集群，还可新增观察者角色。
Observer:观察 Zookeeper 集群的最新状态变化并将这些状态同步过来。

1.4. ZooKeeper 集群搭建

1.4.1.安装

zookeeper 集群搭建指的是 ZooKeeper 分布式模式安装。通常由2n+1台 servers 组成。这是因为为了保证 Leader 选举(基于 Paxos 算法的实现)能过得到多数的支持，所以 ZooKeeper 集群的数量一般为奇数。

Zookeeper 运行需要 java 环境，所以需要提前安装 jdk，然后下载Zookeeper🔗点击跳转
下载并解压ZooKeeper软件压缩包后，可以看到zk包含以下的文件和目录：在这里插入图片描述

bin目录：zk的可执行脚本目录，包括zk服务进程，zk客户端，等脚本。其中，.sh是Linux环境下的脚本，.cmd是Windows环境下的脚本。
conf目录：配置文件目录。zoo_sample.cfg为样例配置文件，需要修改为自己的名称，一般为zoo.cfg。log4j.properties为日志配置文件。
lib：zk依赖的包。
contrib目录：一些用于操作zk的工具包。
recipes目录：zk某些用法的代码示例。
如果要想使用 Observer 模式，可在对应节点的配置文件添加如下配置:
peerType=observer
其次，必须在配置文件指定哪些节点被指定为 Observer，如:
server.1:localhost:2181:3181:observer

1.4.2.单机模式

ZooKeeper的安装包括单机模式安装，以及集群模式安装。
上面提到，conf目录下提供了配置的样例zoo_sample.cfg，要将zk运行起来，需要将其名称修改为zoo.cfg。

单机模式较简单，是指只部署一个zk进程，客户端直接与该zk进程进行通信。
在开发测试环境下，通过来说没有较多的物理资源，因此我们常使用单机模式。当然在单台物理机上也可以部署集群模式，但这会增加单台物理机的资源消耗。故在开发环境中，我们一般使用单机模式。
但是要注意，生产环境下不可用单机模式，这是由于无论从系统可靠性还是读写性能，单机模式都不能满足生产的需求。

1.4.2.1.启动

在Windows环境下，直接双击zkServer.cmd即可。
在Linux环境下，进入bin目录，执行命令

./zkServer.sh start

这个命令使得zk服务进程在后台进行。如果想在前台中运行以便查看服务器进程的输出日志，可以通过以下命令运行：

./zkServer.sh start-foreground

执行此命令，可以看到大量详细信息的输出，以便允许查看服务器发生了什么。

使用文本编辑器打开zkServer.cmd或者zkServer.sh文件，可以看到其会调用zkEnv.cmd或者zkEnv.sh脚本。zkEnv脚本的作用是设置zk运行的一些环境变量，例如配置文件的位置和名称等。
假如启动遇到了一些问题，请点击此处！

1.4.2.3 连接

如果是连接同一台主机上的zk进程，那么直接运行bin/目录下的zkCli.cmd（Windows环境下）或者zkCli.sh（Linux环境下），即可连接上zk。
直接执行zkCli.cmd或者zkCli.sh命令默认以主机号 127.0.0.1，端口号 2181 来连接zk，如果要连接不同机器上的zk，可以使用 -server 参数，例如：

bin/zkCli.sh -server 10.10.10.100:2181

1.4.3.集群模式

单机模式的zk进程虽然便于开发与测试，但并不适合在生产环境使用。在生产环境下，我们需要使用集群模式来对zk进行部署。

1.4.3.1.启动

假如我们打算在三台不同的机器 10.10.10.100，10.10.10.120，10.10.10.10058上各部署一个zk进程，以构成一个zk集群。
三个zk进程均使用相同的 zoo.cfg 配置：

tickTime=2000
dataDir=/home/myname/zookeeper
clientPort=2181
initLimit=5
syncLimit=2
server.1=10.10.10.100:2888:3888
server.2=10.10.10.120:2888:3888
server.3=10.10.10.58:2888:3888

在三台机器dataDir目录（ /home/myname/zookeeper 目录）下，分别生成一个myid文件，其内容分别为1，2，3。然后分别在这三台机器上启动zk进程，这样我们便将zk集群启动了起来。

1.4.3.2.连接

可以使用以下命令来连接一个zk集群：

bin/zkCli.sh -server 10.10.10.100:2181,10.10.10.120:2181,10.10.10.58:2181

成功连接后，可以看到控制台日志输出。

2.数据模型

2.1. ZooKeeper 数据模型

采用树形层次结构，ZooKeeper 树中的每个节点被称为— Znode，和文件系统的目录树一样，ZooKeeper 树中的每个节点可以拥有子节点。但也有不同之处:

Znode 兼具文件和目录两种特点
Znode 具有原子性操作
Znode 存储数据大小有限制
Znode 通过路径引用(路径必须是绝对的)

2.2. 数据结构图

Alt
图中的每个节点称为一个 Znode。每个 Znode 由 3 部分组成:

1 stat:此为状态信息, 描述该 Znode 的版本, 权限等信息
2 data:与该 Znode 关联的数据
3 children:该 Znode 下的子节点

2.3. 节点类型

Znode 有两种，分别为临时节点和永久节点。节点的类型在创建时即被确定，并且不能改变。
临时节点:该节点的生命周期依赖于创建它们的会话。一旦会话结束，临时节点将被自动删除，当然可以也可以手动删除。临时节点不允许拥有子节点。
永久节点:该节点的生命周期不依赖于会话，并且

最低0.47元/天解锁文章

CAFEBABE00

关注

1
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录