java动物园管理员_Java修行第099天 --Zookeeper动物管理员

本文详细介绍了Zookeeper,一个分布式协调服务,主要用于配置管理、名字服务、分布式锁和集群管理。Zookeeper在Hadoop、Hbase、Dubbo等项目中广泛应用。它提供了集中式的配置管理,支持名字服务、分布式锁和集群状态管理,适用于服务发现和领导者选举等场景。Zookeeper的存储结构基于znode,分为四种类型:持久化、持久顺序、临时和临时顺序节点。此外,文章还涵盖了Zookeeper的安装和集群配置过程。
摘要由CSDN通过智能技术生成

一、 ZooKeeper 简介

顾名思义 zookeeper 就是动物园管理员,他是用来管 hadoop(大象)、Hive(蜜蜂)、pig(小 猪)的管理员, Apache Hbase 和 Apache Solr 的分布式集群都用到了 zookeeper;Zookeeper:是一个分布式的、开源的程序协调服务,是 hadoop 项目下的一个子项目。

它提供的主要功能包括:配置管理、名字服务、分布式锁、集群管理。

二、 ZooKeeper 的作用

1.1配置管理

(在我们的应用中除了代码外,还有一些就是各种配置。比如数据库连接等。一般我们都是使用配置文件的方式,在代码中引入这些配置文件。但是如果我们配置非常多,有很多服务器都需要这个配置。)

这是就需要一种集中管理配置的方法. Zookeeper 就是这种服务,它使用 Zab 这种一致性协议来提供一致性。

现在有很多开源项目使用 Zookeeper 来维护配置.

比如:在 HBase 中,客户端就是连接一个Zookeeper,获得必要的 HBase 集群的配置信息,然后才可以进一步操作

又比如:在 Alibaba 开源的 SOA 框架 Dubbo中也广泛的使用 Zookeeper 管理一些配置来实现服务治理.

1.2名字服务

名字服务这个就很好理解了。举个例子

(比如: 为了通过网络访问一个系统,我们得知道对方的 IP地址,但是 IP 地址对人非常不友好,这个时候我们就需要使用域名来访问。但是计算机不能是域名的。

这时怎么办呢?如果我们每台机器里都备有一份域名到 IP 地址的映射,这个倒是能解决一部分问题,但是如果域名对应的 IP 发生变化了又该怎么办呢?于是我们有了DNS 这个东西。我们只需要访问一个大家熟知的(known)的点,它就会告诉你这个域名对应的 IP 是什么。)

在我们的应用中也会存在很多这类问题,特别是在我们的服务特别多的时候,如果我们在本地保存服务的地址的时候将非常不方便,但是如果我们只需要访问一个大家都熟知的访问点,这里提供统一的入口,那么维护起来将方便得多了。

1.3分布式锁

Zookeeper就 是一个分布式协调服务。这样我们就可以利用 Zookeeper 来协调多个分布式进程之间的活动。

比如:在一个分布式环境中,为了提高可靠性,我们的集群的每台服务器上都部署着同样的服务。但是,一件事情如果集群中的每个服务器都进行的话,那相互之间就要协调,编程起来将非常复杂。而如果我们只让一个服务进行操作,那又存在单点。通常还有一种做法就是使用分布式锁,在某个时刻只让一个服务去干活,当这台服务出问题的时候锁释放,立即 fail over 到另外的服务。这在很多分布式系统中都是这么做,这种设计有一个更好听的名字叫 Leader Election(leader 选举)。

比如 :HBase的 Master 就是采用这种机制。但要注意的是分布式锁跟同一个进程的锁还是有区别的,所以使用的时候要比同一个进程里的锁更谨慎的使用。

1.4集群管理

在分布式的集群中,经常会由于各种原因,比如硬件故障,软件故障,网络问题,有些节点会进进出出。有新的节点加入进来,也有老的节点退出集群。这个时候,集群中其他机器需要感知到这种变化,然后根据这种变化做出对应的决策。

比如:一个分布式的 SOA 架构中,服务是一个集群提供的,当消费者访问某个服务时,就需要采用某种机制发现现在有哪些节点可以提供该服务(这也称之为服务发现,比如 : Alibaba 开源的SOA 框架 Dubbo 就采用了 Zookeeper 作为服务发现的底层机制)。还有开源的 Kafka 队列就采用了 Zookeeper 作为 Cosnumer 的上下线管理。

三、 Zookeeper 的存储结构

1 Znode

在 Zookeeper 中,znode 是一个跟 Unix 文件系统路径相似的节点,可以往这个节点存储或获取数据。

Zookeeper 底层是一套数据结构。这个存储结构是一个树形结构,其上的每一个节点,我们称之为“znode”zookeeper 中的数据是按照“树”结构进行存储的。而且 znode 节点还分为 4 中不同的类型。

每一个 znode 默认能够存储 1MB 的数据(对于记录状态性质的数据来说,够了)可以使用 zkCli 命令,登录到 zookeeper 上,并通过 ls、create、delete、get、set 等命令操作这些 znode 节点

2 Znode 节点类型

(1)PERSISTENT 持久化节点:所谓持久节点,是指在节点创建后,就一直存在,直到有删除操作来主动清除这个节点。否则不会因为创建该节点的客户端会话失效而消失。

(2)PERSISTENT_SEQUENTIAL 持久顺序节点:这类节点的基本特性和上面的节点类型是一致的。额外的特性是,在 ZK 中,每个父节点会为他的第一级子节点维护一份时序,会记录每个子节点创建的先后顺序。基于这个特性,在创建子节点的时候,可以设置这个属性,那么在创建节点过程中,ZK 会自动为给定节点名加上一个数字后缀,作为新的节点名。

这个数字后缀的范围是整型的最大值。在创建节点的时候只需要传入节点 “/test_”,这样之后,zookeeper 自动会给”test_”后面补充数字。

(3)EPHEMERAL 临时节点:和持久节点不同的是,临时节点的生命周期和客户端会

话绑定。也就是说,如果客户端会话失效,那么这个节点就会自动被清除掉。注意,这里提到的是会话失效,而非连接断开。另外,在临时节点下面不能创建子节点。

这里还要注意一件事,就是当你客户端会话失效后,所产生的节点也不是一下子就消失了,也要过一段时间,大概是 10 秒以内,可以试一下,本机操作生成节点,在服务器端用命令来查看当前的节点数目,你会发现客户端已经 stop,但是产生的节点还在。

(4) EPHEMERAL_SEQUENTIAL 临时自动编号节点:此节点是属于临时节点,不过带有顺序,客户端会话结束节点就消失。

四、 安装 zookeeper

1 安装单机版

1.1安装 Linux

1.2安装 JDK

配置环境变量

export JAVA_HOME=/usr/local/jdk

export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export PATH=$JAVA_HOME/bin:$PATH

1.3上传 Zookeeper

官方资源包可在 zookeeper.apache.com 站点中下载。最新发布版本为:3.4.12。

1.4解压 Zookeeper 压缩包

[root@localhost temp]# tar -zxf zookeeper-3.4.6.tar.gz

[root@localhost temp]# cp zookeeper-3.4.6 /usr/local/zookeeper -r

1.5Zookeeper 目录结构

1. bin:放置运行脚本和工具脚本,如果是 Linux 环境还会有有 zookeeper 的运

行日志 zookeeper.out

2. conf:zookeeper 默认读取配置的目录,里面会有默认的配置文件

3. contrib:zookeeper 的拓展功能

4. dist-maven:zookeeper 的 maven 打包目录

5. docs:zookeeper 相关的文档

6. lib:zookeeper 核心的 jar

7. recipes:zookeeper 分布式相关的 jar 包

8. src:zookeeper 源码

1.7启动 Zookeeper

默认加载配置文件:./zkServer.sh start:默认的会去 conf 目录下加载 zoo.cfg 配置文件。

指定加载配置文件:./zkServer.sh start 配置文件的路径。

2 安装集群版

2.1Zookeeper 集群中的角色

Zookeeper 集群中的角色主要有以下三类

2.2设计目的

1.最终一致性:client 不论连接到哪个 Server,展示给它都是同一个视图,这是 zookeeper

最重要的性能。

2 .可靠性:具有简单、健壮、良好的性能,如果消息 m 被到一台服务器接受,那么它将被所有的服务器接受。

3 .实时性:Zookeeper 保证客户端将在一个时间间隔范围内获得服务器的更新信息,或者服务器失效的信息。但由于网络延时等原因,Zookeeper 不能保证两个客户端能同时得到

刚更新的数据,如果需要最新数据,应该在读数据之前调用 sync()接口。

4 .等待无关(wait-free):慢的或者失效的 client 不得干预快速的 client 的请求,使得每个 client 都能有效的等待。

5.原子性:更新只能成功或者失败,没有中间状态。

6 .顺序性:包括全局有序和偏序两种:全局有序是指如果在一台服务器上消息 a 在消息

b 前发布,则在所有 Server 上消息 a 都将在消息 b 前被发布;偏序是指如果一个消息 b 在消息 a 后被同一个发送者发布,a 必将排在 b 前面。

2.3集群安装

使用 3 个 Zookeeper 应用搭建一个伪集群。应用部署位置是:192.168.70.143。服务监听端口分别为:2181、2182、2183。投票选举端口分别为 2881/3881、2882/3882、2883/3883。

tar -zxf zookeeper-3.4.6.tar.gz

将解压后的 Zookeeper 应用目录重命名,便于管理

mv zookeeper-3.4.12 zookeeper01

2.3.1提供数据缓存目录

在 zookeeper01 应用目录中,创建 data 目录,用于缓存应用运行数据

cd zookeeper01

mkdir data

2.3.2复制应用

复制两份 Zookeeper 应用。用于模拟集群中的 3 个节点。

cp -r zookeeper01 zookeeper02

cp -r zookeeper01 zookeeper03

2.3.3提供配置文件

在 zookeeper 应用目录中有子目录 conf。其中有配置文件模板:zoo_sample.cfg

cp zoo_sample.cfg zoo.cfg

zookeeper 应用中的配置文件为 conf/zoo.cfg。

2.3.4修改配置文件 zoo.cfg - 设置数据缓存路径

dataDir 参数值为应用运行缓存数据保存目录。是 3.2.3 步骤中创建的目录。使用绝对路

径赋值。不同的应用路径不同。

2.3.5提供应用唯一标识

在 Zookeeper 集群中,每个节点需要一个唯一标识。这个唯一标识要求是自然数。且唯

一标识保存位置是:$dataDir/myid。其中 dataDir 为配置文件 zoo.cfg 中的配置参数

在 data 目录中创建文件 myid : touch myid

为应用提供唯一标识。本环境中使用 1、2、3 作为每个节点的唯一标识。

vi myid

简化方式为: echo [唯一标识] >> myid。 echo 命令为回声命令,系统会将命令发送的

数据返回。 '>>'为定位,代表系统回声数据指定发送到什么位置。 此命令代表系统回声数

据发送到 myid 文件中。 如果没有文件则创建文件。

2.3.6修改配置文件 zoo.cfg - 设置服务、投票、选举端口

vi zoo.cfg

clientPort=2181 #服务端口根据应用做对应修改,zk01-2181,zk02-2182,zk03-2183

server.1=192.168.70.143:2881:3881

server.2=192.168.70.143:2882:3882

server.3=192.168.70.143:2883:3883

2.3.7启动 ZooKeeper 应用

bin/zkServer.sh start

ZooKeeper 集群搭建后,至少需要启动两个应用才能提供服务。因需要选举出主服务节

点。启动所有 ZooKeeper 节点后,可使用命令 bin/zkServer.sh status 来查看节点状态。如下:

Mode: leader - 主机

Mode: follower - 备份机

2.3.7启动 ZooKeeper 应用

bin/zkServer.sh start

ZooKeeper 集群搭建后,至少需要启动两个应用才能提供服务。因需要选举出主服务节

点。启动所有 ZooKeeper 节点后,可使用命令 bin/zkServer.sh status 来查看节点状态。如下:

Mode: leader - 主机

Mode: follower - 备份机

2.3.10 控制台客户端常用命令

本课程只介绍常用命令。

connect host:port - 连接其他的 ZooKeeper 应用。

ls path - 列表路径下的资源。在 ZooKeeper 控制台客户端中,没有默认列表功能,必须

指定要列表资源的位置。 如: ls / ; ls /path 等。

create [-e] [-s] path data - 创建节点,如: create /test 123 创建一个/test 节点,节点携

带数据信息 123。 create -e /test 123 创建一个临时节点/test,携带数据为 123,临时节点只在当前会话生命周期中有效,会话结束节点自动删除。 create -s /test 123 创建一个顺序节点/test,携带数据123,创建的顺序节点由ZooKeeper自动为节点增加后缀信息,如-/test00000001等。-e 和-s 参数可以联合使用。

get path - 查看指定节点的数据。 如: get /test。结果如下:

[zk: 192.168.199.175:2181(CONNECTED) 22] get /test

123

cZxid = 0xd # 创建节点时的事务 ID,由 ZooKeeper 维护。

ctime = Tue Jun 12 07:45:53 PDT 2018

mZxid = 0x1f # 当前节点携带数据最后一次修改的事务 ID。

mtime = Tue Jun 12 07:52:53 PDT 2018

pZxid = 0x21 # 子节点列表最后一次修改的事务 ID。

cversion = 1 # 节点版本号,当节点的子节点列表发生变化时,版本变更。

dataVersion = 2 # 数据版本号,当节点携带数据发生变化时,版本变更。

aclVersion = 0

ephemeralOwner = 0x0 # 此数据值不是 0x0 时,代表是临时节点

dataLength = 3 # 节点携带数据长度

numChildren = 1 # 子节点数量

set path data [version] - 设置对应位置节点的数据。如: set /test 'test data'。 如果要设

置的数据中有空格,则使用单引号界定数据的范围。每次修改数据后,dataVersion 属性自增。

那么在 set 命令中可以指定 version,version 数据必须与上次查询的值一致,用于保证本次修

改命令执行时,没有其他会话修改此数据。

delete path [version] - 删除指定节点,此命令不能删除有子节点的节点。如:delete /test。

其中 version 参数和 set 命令的 version 含义一致

rmr path - 删除指定结点,包括子节点。

quit - 退出控制台

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值