ZooKeeper入门

最新推荐文章于 2023-11-02 14:16:43 发布

manmanlu2006

最新推荐文章于 2023-11-02 14:16:43 发布

阅读量396

点赞数

分类专栏：大数据文章标签： zookeeper

本文链接：https://blog.csdn.net/manmanlu2006/article/details/120408402

版权

大数据专栏收录该内容

12 篇文章 3 订阅

订阅专栏

一、zookeeper介绍

官方文档上这么解释zookeeper，它是一个分布式服务框架，是Apache Hadoop 的一个子项目，它主要是用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等。
上面的解释有点抽象，简单来说zookeeper=文件系统+监听通知机制。

Apache ZooKeeper致力于开发和维护开源服务器，实现高度可靠的分布式协调。

整个大数据生态圈就是一个动物园。Hadoop就是小象，hive就是一个小蜜蜂，hbase图标就是一个鲸鱼。等等都是用动物来作为图标，zookeeper的图标就是一个管理员。所以顾名思义，zookeeper就是管理他们的嘛！

ZooKeeper的设计目标就是将复杂易出错的分布式一致性服务封装起来，构成高效可靠的原语集，并以一系列简单易用的接口提供给用户使用，支持Java和C的接口。

Index of /zookeeperhttps://downloads.apache.org/zookeeper/

二、zookeeper功能

（1）存储数据：为客户管理少量数据；

（2）监听：为客户端监听指定数据结点的状态，并在结点发生变化时，通知客户端；

三、选举流程简述

目前有5台服务器，每台服务器均没有数据，它们的编号分别是1,2,3,4,5,按编号依次启动，它们的选择举过程如下：

服务器1启动，给自己投票，然后发投票信息，由于其它机器还没有启动所以它收不到反馈信息，服务器1的状态一直属于Looking(选举状态)。
服务器2启动，给自己投票，同时与之前启动的服务器1交换结果，由于服务器2的编号大所以服务器2胜出，但此时投票数没有大于半数，所以两个服务器的状态依然是LOOKING。
服务器3启动，给自己投票，同时与之前启动的服务器1,2交换信息，由于服务器3的编号最大所以服务器3胜出，此时投票数正好大于半数，所以服务器3成为领导者，服务器1,2成为小弟。
服务器4启动，给自己投票，同时与之前启动的服务器1,2,3交换信息，尽管服务器4的编号大，但之前服务器3已经胜出，所以服务器4只能成为小弟。
服务器5启动，后面的逻辑同服务器4成为小弟。

什么场景下 Zookeeper 需要选举？

当 Zookeeper 集群中的一台服务器出现以下两种情况之一时，需要进入 Leader 选举。

（1）服务器初始化启动。

（2）服务器运行期间 Leader 故障。

选择机制中的概念

1、Serverid：服务器ID

比如有三台服务器，编号分别是1,2,3。

编号越大在选择算法中的权重越大。

2、Zxid：数据ID

服务器中存放的最大数据ID.

值越大说明数据越新，在选举算法中数据越新权重越大。

3、Epoch：逻辑时钟

或者叫投票的次数，同一轮投票过程中的逻辑时钟值是相同的。每投完一次票这个数据就会增加，然后与接收到的其它服务器返回的投票信息中的数值相比，根据不同的值做出不同的判断。

4、Server状态：选举状态

LOOKING，竞选状态。
FOLLOWING，随从状态，同步leader状态，参与投票。
OBSERVING，观察状态,同步leader状态，不参与投票。
LEADING，领导者状态。

manmanlu2006

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
ZooKeeper入门

一、zookeeper介绍官方文档上这么解释zookeeper，它是一个分布式服务框架，是Apache Hadoop 的一个子项目，它主要是用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等。上面的解释有点抽象，简单来说zookeeper=文件系统+监听通知机制。Apache ZooKeeper致力于开发和维护开源服务器，实现高度可靠的分布式协调。整个大数据生态圈就是一个动物园。Hadoop就是小象，hive就是一个小蜜蜂，hba
复制链接

扫一扫