Java面试题zookeeper

1ZooKeeper 什么 

ZooKeeper 是一个放源码的分布式协调服务,它是集群的管理者,监视着 群中各个节点

的状据节交的反馈下一理操作。,将 用的和性效、

能稳定的系统提供给用户。 

分布以基于  Zookeeper 实现如数/、负载均 务、

式协调/通知、集群管理Master 选举、分布式锁和分布式队列 等功能。 

Zookeeper 保证了下分布式一致性特性: 

1)顺序一致性 

2)原子性 

3)单一视图 

4)可靠性 

5)实时性(最终一致性) 
客户端的读请求可以被集群中的任意一台机器处理,如果读请求在节点上注 了监听器,这个监听器也是由所连接的 zookeeper 机器处理。对于写请求, 这些请求会同时发给其他 zookeeper 机器并达成一致后,请求才会返回 功。因此,随着 zookeeper 的集机器增多,读请求的吞吐会提高但是写请求 的吞吐会下降。 

有序性是 zookeeper 中非常重要的一个特性,所有的更新都是全局有序的,每 个更新都有一个唯一的时间戳,这个时间戳称为 zxidZookeeper Transaction Id)。而读请求只会相对于更新有序,也就是读请求的返回结果 中会带有这个 zookeeper 最新的 zxid 

2ZooKeeper 供了什 

  文件系统 

  通知机制 

3Zookeeper 件系 

Zookeeper 提供一多层级的节点命名空间(节点称 znode。与文件系统 不同的是,这些节点都可以设置关联的数据,而文件系统中只有文件节点可 存放数据而目录节点不行。 Zookeeper 为了保证高吞吐和低延迟,在存中维护了这个树状目录结构 这种特性使得 Zookeeper 不能用存放大量的数据,每个节点的存放数据上  1M 

4ZAB 协议 

ZAB 协议是为分布式协调服务 Zookeeper 专门设计的一种支持崩溃恢复的原 广播协议。 ZAB 协议包括两种基本的模式:崩溃恢复和消息广播。 

当整个 zookeeper 群刚刚启动或者 Leader 服务器宕机、重启或者网络故障 导致不存在过半的服务器与 Leader 服务器保持正常通信时,所有进程(服 器)进入崩溃恢复模式,首先选举产生新的 Leader 服务器,然后集群中 Follower 服务器开与新的 Leader 服务进行数据同步,当集群中超过半数 机器与该 Leader 服务器完成数据同步之后,退出恢复模式进入消息广播模 式,Leader 服务器开始接收客户端的事务请求生成事物提案来进行事务请求处理。 

5、四种型的数据 Znode 

1PERSISTENT-久节 

除非手动删除,否则节点一直存在于 Zookeeper  

2EPHEMERAL-时节点 
临时节点的生命周期与客户端会话绑定,一旦客户端会话失效(客户端 zookeeper 

开不一定会话失效),那么这个客户端创建的所有临时节点 都会被移除 

3PERSISTENT_SEQUENTIAL-持久顺 
基本特性同持久节点,只是增加了顺序属性,节点名后边会追加一个由父节 维护的自增整

型数字。 

4EPHEMERAL_SEQUENTIAL-临时顺节点 
基本特性同临时节点,增加了顺序属性,节点名后边会追加一个由父节点维 的自增整型数

字。 

6Zookeeper Watcher  -- 据变更通知 

Zookeeper 允许客端向服务端的某个 Znode 注册一个 Watcher 监听,当服 务端的一

定事  Watcher服务向指定客个事 件通式的

功能,然后客户端根据 Watcher 通知状态事件类 型做出业务上的改变 

工作机制: 

1)客户端注册 watcher 

2)服务端处理 watcher 

3)客户端回调 watcher 

Watcher 特性总结: 

1)一次性 
无论是服务端还是客户端,一旦一个 Watcher    Zookeeper 都会将 其从相应存储

中移这样计有效的了服的压力,对于 非常频繁

不断的向客户端发送事件通知,无论对于网络还 是服务端的压力都非常大 

2)客户端串行执行 

客户端 Watcher 的过程是一个串行同步的过程。 

3)轻量 

  Watcher 通知非常简单,只会告诉客户端发生了事件,而不会说明事件 具体内容。 

  客户端向服务端注册 Watcher 的时候,并不会把客户端真实 Watcher 对象实体传递到

服务端,仅仅是在客户端请求中使用 boolean 类型属性进行  

4watcher event 异步发送 watcher 通知事件从 server 送到 client 是异步的这就存在一个问题,不同的客户端和服务器之间通过 socket 进行 通信由于网络延迟或其他因素导致客户端在不通的时刻监听到事件,由于 Zookeeper 本身提供 ordering guarantee,即客户端监听事件后,才会感知 它所监视 znode 发生了变化。所我们使用 Zookeeper 不能期望能够监控到 节点每次的变化。Zookeeper 只能保证最终一致性,而无法保证强一致性。 5)注册 watcher getDataexistsgetChildren 
6)触发 watcher createdeletesetData 
7)当一个客户端连接到一个新的服务器上时,watch 将会被以任意会话事件 触发。当与一个服务器失去连接的时候,是无法接收到 watch 的。而当 client 新连接时,如果需要的话,所有先前注册过的 watch,都会被重新注 册。通常这是完全透明的。只有在一个特殊情况下,watch 可能会丢失:对 一个未创建的 znode  exist watch,如果在客户端断开连接期间被创建了, 并且随后在客户端连接上之前又删除了,这种情况下,这 watch 件可能会 被丢失。 

7、客户注册 Watcher 实现 

1)调用 getData()/getChildren()/exist()三个 API,传入 Watcher 对象 2)标记 request,封装 Watcher  WatchRegistration 

3)封装成 Packet 对象,发服务端发送 request 
4)收到服务端响应后,将 Watcher  ZKWatcherManager 中进行管理 5求返回,完成注册。 

8、服务处理 Watcher 实现 

1)服务端接收 Watcher 并存 
接收,处理请要注  Watcher要的话将据节 节点径和 ServerCnxnServerCnxn 代表一个客端和服务端的连接 实现了 Watcher  process 接口  Watcher 对象储在  WatcherManager   WatchTable  watch2Paths 中去 

2Watcher  
以服务端接收到 setData() 事务请求触发 NodeDataChanged 为例: 2.1  WatchedEvent 

将通知状态(SyncConnected)、事件类型NodeDataChanged)以及节点路径 封装成一个 WatchedEvent  

 查询 Watcher 

   WatchTable 据节点路径查找 Watcher 

  没找到;说明没有客户端在该数据节点上注册过 Watcher 

  找到;提取并从 WatchTable  Watch2Paths 中删除对应 Watcher(从这 里可以看出 

Watcher 在服务端是一次性的,触发一次就失效了 

3)调用 process 法来触 Watcher 
这里 process 主要是通过 ServerCnxn 应的 TCP 连接发送 Watcher 事件 通知 

9、客户回调 Watcher 

客户端 SendThread 线程接收事件通知,交由 EventThread 线回调 Watcher 

客户端的 Watcher 制同样是一次性的,一旦被触发后,该 Watcher 就失效  

10ACL  

UGOUser/Group/Others 
目前在 Linux/Unix 件系统中使用,也是使用最广泛的权限控制方式。是 种粗粒度的文件

系统权限控制模式。 

ACLAccess Control List)访问控制列表 

包括三个方面: 

权限模式(Scheme 

1IP:从 IP 地址粒度进行权限控制 
2Digest:最常用,用类似于 username:password 的权限标识来进行权 配置,便于区

分不同应用来进行权限控制 

3World:最开的权限控制方式,是一种特殊 digest ,只有一个 权限标识

“world:anyone 

4Super:超级 

授权对象 
授权对象指的是权限赋予的用户或一个指定实体,例如 IP 地址或是机器灯 权限 

Permission

1CREATE:数节点创建权限,允许授权对象在 Znode 创建子节点 2DELETE:子节点删权限,允许授权对象删除该数据节点的子节 
3READ:数据点的读取权限,允许授权对象访问该数据节点并读取其数 内容或子节点列表等 
4WRITE:数据节点更新权限,允许授权对象对该数据节点进行更新操 5ADMIN:数据节点理权限,允许授权对象对该数据节点进 ACL 相关设 置操 

11Chroot  
3.2.0 版本后,添加 Chroot 特性,该特允许每个客户端为自己设置一 命名空间如果一个客户端设置了 Chroot,那么该客户端服务器的任何操 作,都将会被限制在其自己的命名空间下。 

通过设置 Chroot够将一个客户端应用于 Zookeeper 服务端一颗子树相 对应,那些多个应用公用一个 Zookeeper 进群的场景,对实现不同应用 的相互隔离非常有帮助。 

12、会话管理 

分桶策略:将类似的会话放在同一区块中进行管理,以便于 Zookeeper 对会话 进行不同块的隔离处理以及同一区块的统一处理。 

分配原则:每个会话的“下次超时时间点”(ExpirationTime 计算公式: 

ExpirationTime_ = currentTime + sessionTimeout 
ExpirationTime = (ExpirationTime_ / ExpirationInrerval + 1) * 
ExpirationInterval , ExpirationInterval  Zookeeper 会话超检查时 间间隔,默认 tickTime 

13、服务 

Leader 
1)事务请求的唯一调度和处理者,保证集群事务处理的顺序性 2)集群内部各服务的调度者 

Follower 
1)处理客户端的非事务请求,转发事务请求给 Leader 服务 2)参与事务请求 Proposal 的投 

3)参与 Leader 举投票 

Observer 

13.0 版本以后入的一个服务器角色,在不影响集群事务处理能力的基 上提升集群的

非事务处理能力 

2)处理客户端的非事务请求,转发事务请求给 Leader 服务 3)不参与任何形式的投票 

14Zookeeper  Server  

服务器具有四种状态,分别是 LOOKINGFOLLOWINGLEADINGOBSERVING 1

LOOKING:寻  Leader 状态。当服务器处于该状态时,它会认为当前集 群中没 

Leader,因此需要进入 Leader 选举状态 

2FOLLOWING:跟随者状态。表明当前服务器角色是 Follower 

3LEADING:领者状态。表明当前服务器角色 Leader 4OBSERVING:观察者状态。表明当前服务器角色是 Observer 

15、数据 

整个集群完成 Leader 选举之后,LearnerFollower  Observer 的统称) 回向 Leader 

务器进行注册。当 Learner 服务器想 Leader 服务器完成注册 后,进入数据同步环节 

数据同步流程:(均以消息传递的方式进行) 

Learner  Learder  

数据同步 

同步确认 

Zookeeper 的数据步通常分为四类: 

1)直接差异化同步(DIFF 同步) 

2)先回滚再差异化同步(TRUNC+DIFF 同步) 

3)仅回滚同步(TRUNC 同步 

4)全量同步(SNAP 同步) 
在进行数据同步前,Leader 服务器会完成数据同步初始化 
peerLastZxid 
·  learner 服务器册时发送的 ACKEPOCH 消息中提取 lastZxid(该 Learner 服务器

处理的 ZXID 

minCommittedLog 
· Leader 服务器 Proposal 缓存队列 committedLog 中最 ZXIDmaxCommittedLog 

· Leader 服务器 Proposal 缓存队列 committedLog 中最大 ZXID 直接差异 化同步(DIFF 同步) 
· 场景:peerLastZxid 介于 minCommittedLog  maxCommittedLog 之间先 回滚再异化同步(TRUNC+DIFF 同步) 
· 场景:当新的 Leader 服务器发现某个 Learner 服务器包含了一条自己没 有的事务记录,那么就需要让该 Learner 服务器进行事务回--回滚到 Leader 服务上存在的,同时也是最接近于 peerLastZxid  ZXID 仅回滚同 步(TRUNC 同步 
· 场景:peerLastZxid 大于 maxCommittedLog 

全量同步(SNAP 同步) 

· 场景一:peerLastZxid 小于 minCommittedLog 
· 场景二:Leader 服务器上没有 Proposal 存队列且 peerLastZxid 不等  lastProcessZxid 

16zookeeper 是如何证事顺序一性的 

zookeeper 采用了局递增的事 Id 来标识,所有 proposal(提议)都在 被提出的时候加上了 zxidzxid 际上是一个 64 位的字, 32  epoch 时期; 纪元; ; 新时代)用来标识 leader 周期,如果有新的 
leader 产生出来,epoch 会自增,低 32 来递增计数。当新产生 proposal 的时候,会依据数据库的两阶段过程,首先会向其他的 server 发出事务执行求,如果超过半数的机器都能执行并且能够成功,那么就会开始执行。 

17、分布集群为什么 Master 

在分环境有些业务只需群中的某机器执行,其 器可以共享这个结果,这样可以大大减少重复计算,提高性能,于是就需要进leader选举。 

18zk 点宕机如何处理 

Zookeeper 本身也集群,推荐配置不少于 3 个服务器。Zookeeper 自身也要 保证当个节点宕机时,其他节点会继续提供服务。 

如果是一个 Follower 宕机,还有 2 台服务提供访问,因为 Zookeeper  的数据是有多个副本的,数据并不会丢失; 
如果是一个 Leader 机,Zookeeper 举出新 Leader 

ZK 集群的机制是只超过半数的节点正常,集群就能正常提供服务。只有 ZK 节点挂太多,只剩一半或不到一半节点能工作,集群才失效。 

所以 
3 个节点的 cluster 以挂掉 1 个节点(leader 可以得到 2 >1.5) 
2 个节点的 cluster 不能挂掉任何 1 个节(leader 可以得到 1 <=1)  

19zookeeper 负载均 nginx 负载均 

zk 的负载均衡是可以调控nginx 只是能权重,其他需要可控的都需要自 写插件;但是 nginx 的吞吐量比 zk 大很多,应该说按业务选择用哪种方式。 

20. Zookeeper 哪几种种部署模 

部署模式:单机模式、伪集群模式、集群模式。 

21. 集群最台机集群规则是怎样?

集群规则为 2N+1 N>0,即 3  

22. 集群支添加机 

其实就是水平扩容了,Zookeeper 在这方不太好。两种方式 

全部重启:关闭所有 Zookeeper 服务,修改配置之后启动。不影响之前客户 的会话。 逐个重启:在过半存活即可用的原则下,一台机器重启不影响整个集群对外 供服务。这是比较常用的方式。 

3.5 版本开始支持动扩容。 

23. Zookeeper 节点的 watch 通知是久的吗?为什么是永?

不是。官方声明:一个 Watch 事件是一个次性的触发器,当被设置 Watch 的数据生了改变的时候,则服务器将这个改变发送给设置了 Watch 的客户 ,以便通知它们。 

为什么不是永久的,举个例子,如果服务端变动频繁,而监听的客户端很多 况下,每次变动都要通知到所有的客户端,给网络和服务器造成很大压力。 一般是客户端执行 
getData(“/节点 A”,true),如果节点 A 发生了变更或删 除,客户端会得到它的 watch 事件,但是在之后节点 A 又发生了变更,而客 户端又没有设置 watch 事件,就不再给客户端发送。 

在实际应用中,很多情况下,我们的客户端不需要知道服务端的每一次变动 我只要最新的数据即可。 

24. Zookeeper  java 户端 

java 客户端:zk 自带 zkclient  Apache 开源的 Curator 

25. chubby 么,和 zookeeper 比你么看 

chubby  google ,完全实现 paxos 法,不开源。zookeeper  chubby 的开实现,使用 zab 协议paxos 算法的变种 

26. 说几个 zookeeper 常用的 

常用命令:ls get set create delete  

27. ZAB  Paxos 算法的系与区别 

相同点: 
1)两者都存在一个类似于 Leader 进程角色,由其负责协调多 Follower 进程的运 

2Leader 进程都会等待超过半数的 Follower 做出正确的反馈后,才会将 一个提案进行提交 
3ZAB 协议中, Proposal 中都包 epoch 值来代当前的 Leader 周期,Paxos 中名字为 Ballot 

不同点: 
ZAB 用来构建高可用的分布式数据主备系统(Zookeeper),Paxos 是用来构建 分布一致性状态机系统。

28. Zookeeper 典型应场景 

Zookeeper 是一个型的发布/订阅模式的分布式数据管理与协调框架,开发人 员可以使用

它来进行分布式数据的发布和订阅。 

通过对 Zookeeper 丰富的数据节点进行交叉使用,配 Watcher 事件通知 机制,可

常方便的构建一系列分布式应用中年都会涉及的核心功能,如 1)数据发布/订阅 

2)负载均衡 

3)命名服务 

4)分布式协调/ 

5)集群管理 

6Master 选举 

7)分布式锁 

8)分布式队列 

数据发布/订阅 

介绍 
数据发布/订阅系统,即所谓的配置中心,顾名思义就是发布者发布数据供订 者进行数据订

阅。 

目的 

动态获取数据(配置信息) 

实现数据(配置信息)的集中式管理和数据的动态更新 

设计模式 

Push  

Pull  

数据(配置信息)特性 

1)数据量通常比较小 

2)数据内容在运行时会发生动态更新 

3)集群中各机器共享,配置一致 
如:机器列表信息、运行时开关配置、数据库配置信息等 
基于 Zookeeper 现方式 
· 数据存储:将数据(配置信息)存储到 Zookeeper 上的一个数节点 

· 数据获取:应用在启动初始化节点从 Zookeeper 数据节点读取据,并在 该节点上注册一个数据变更 Watcher 
· 数据变更:当变更数据时,更新 Zookeeper 对应节点数据,Zookeeper  将数据变通知发到各客户端,客户端接到通知后重新读取变更后的数据即  

负载均衡 

zk 的命名服务 
命名服务是指通过指定的名字来获取资源或者服务的地址,利 zk 创建一个 全局的路径,这个路可以一个名字向集的集群,的服 地址,或象等等。 

分布式通知和协调 
对于系统调度来说:操作人员发送通知实际是通过控制台改变某个节点的 态,然后 zk 将这些变化发送给注册了这个节点的  watcher 所有客户端。 对于行情况汇报:每个工作进程都在目录建一个临点。 作的这样总的控目录子节点的变化获得工作进度的 实时的全局情况。 

zk 的命名服务(文件系统) 
命名服务是指通过指定的名字来获取资源或者服务的地址,利 zk 创建一个 全局的路径,即是唯路径个路径就作为名字,指群中 群,提供或者一个远程的对象等等。 

zk 的配置管理(文件系统、通知机制) 
程序分布式的部署在不同的机器上,将程序的配置信息放在 zk  znode  当有配置发生改变时,也就是 znode 发生变化时,可以过改变 zk 中某个目 节点的内容,利用 watcher 通知给各个客户端,从而更改配置 Zookeeper 集群管(文件系统、通知机制) 所谓集群管理无在乎两点:是否有机器退出和加入、选举 master 

对于第一点,所有机器约定在父目录下创建临时目录节点,然后监听父目录  
的子节点变化消息。一旦有机器挂掉,该机器与 zookeeper 的连断开,其所 创建的临时目录节点被删除,所有其他机器都收到通知:某个兄弟目录被删 除,于是,所有人都知道:它上船了。 

165

新机器入也是类所有机器到通知:弟目录加入,highcount 又有 第二点,稍微一下,所器创时顺序编录节 次选号最机器作为 master 就好。 

Zookeeper 分布式锁(文件系统、通知机制) 
有了 zookeeper 致性文件系统,锁的问题变得容易。锁服务可以分为 类,一个是保持独占,另一个是控制时序。 

对于第一类,我们将 zookeeper 上的一个 znode 看作是一把锁通过 createznode 方式来实现。所有客户端都去创建 /distribute_lock 节点, 最终成功创建的那个客户端也即拥有了这把锁。用完删除掉自己创建的 distribute_lock 节点就释放出 

对于第类,  /distribute_lock 已经预先在,所有客端在它面创建 时顺编号目录节点,和选 master 一样,编号最小的获得锁,用完删除, 次方便。 

Zookeeper 队列管(文件系统、通知机制) 

两种类型的队列: 
1)同步队列,当一个队列的成员都聚齐时,这个队列才可用,否则一直等待 所有成员到达。 

2)队列按照 FIFO 方式进行入队和出队操作。 

第一类,在约定目录下创建临时目录节点,监听节点数目是否是我们要求的 目。 

第二类,和分布式锁服务中的控制时序场景基本原理一致,入列有编号,出 按编号。在特定的目录下创建 PERSISTENT_SEQUENTIAL 节点,创建成功 Watcher 通知等待的队列,队列删除序列号最小的节点用以消费。此场景下 Zookeeper  znode 用于消息存储,znode 存储的数据是消息队列中的消息 内容,SEQUENTIAL 序列号就是消息的编号,按序取出即可。由于创建的节点是 持久化的,所以不必担心队列消息的丢失问题 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

老歪不歪

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值