Zookeeper

最新推荐文章于 2024-03-16 23:45:18 发布

倔强中的小白

最新推荐文章于 2024-03-16 23:45:18 发布

阅读量316

点赞数

分类专栏：分布式 zookeeper 文章标签：分布式 zookeeper

本文链接：https://blog.csdn.net/tryingpfq/article/details/105167172

版权

Zookeeper是一个分布式协调框架，提供分布式数据一致性解决方案。本文介绍了Zookeeper的基本概念，包括分布式环境下的挑战、CAP/BASE理论，以及Zookeeper的安装、集群搭建、角色选举、ZAB协议等核心内容。同时，讲解了Zookeeper的命令操作、Java连接方式以及其在配置管理、分布式锁、负载均衡和master选举等应用场景中的实现。

摘要由CSDN通过智能技术生成

初识Zookeeper

前言

现在在分布式当中，基本离不开zookeeper的使用。分布式环境下，主要的特点的分布性、并发性、无序性，自然也会面临一些问题，比如（网络通信：网络本身的不可靠性，因此会涉及到一些网络通信的问题；网络分区：也就是我们通常说的脑裂，当网络发生异常导致分布式系统中部分节点之间的网络延时不断增大，最终导致组成分布式架构的所有节点，只有部分节点能够正常通信；三态：在分布式架构中，就三种状态，成功、失败和超时；分布式事务：ACID，原子性、一致性、隔离性、持久性）。

看完这篇文章，可以对zk有些感性的认识，比如单机、集群如何安装和搭建，一些基本概念，操作命令，客户端连接，leader选举过程，已近一些应用场景和实现过程，ZAB协议。

中心化和去中心化

假如在分布式系统中，所有节点都围绕一个中心节点去通信或者数据同步，那么假如当这个节点挂掉的时候，这个分布式系统就蹦了。所以在分布式中，每一个节点都是高度自治的，节点之间可以自由连接，任何一个节点都可能成为阶段性的中心，但不具备强制性的中性控制能力。分布式架构里面，很多的架构思想采用的是：当集群发生故障的时候，集群中的人群会自动“选举”出一个新的领导。最典型的是： zookeeper / etcd

CAP/BASE理论

CAP：在分布式中，不管如何，同时只能满足两种条件。CP or AP

C（一致性 Consistency）: 所有节点上的数据，时刻保持一致
A可用性（Availability）：每个请求都能够收到一个响应，无论响应成功或者失败
分区容错（Partition-tolerance）：表示系统出现脑裂以后，可能导致某些server与集群中的其他机器失去联系

CAP理论仅适用于原子读写的Nosql场景，不适用于数据库系统

BASE

基于CAP理论，CAP理论并不适用于数据库事务（因为更新一些错误的数据而导致数据出现紊乱，无论什么样的数据库高可用方案都是徒劳），虽然XA事务可以保证数据库在分布式系统下的ACID特性，但是会带来性能方面的影响；eBay尝试了一种完全不同的套路，放宽了对事务ACID的要求。提出了BASE理论Basically available ：数据库采用分片模式，把100W的用户数据分布在5个实例上。如果破坏了其中一个实例，仍然可以保证80%的用户可用

soft-state：在基于client-server模式的系统中，server端是否有状态，决定了系统是否具备良好的水平扩展、负载均衡、故障恢复等特性。 Server端承诺会维护client端状态数据，这个状态仅仅维持一小段时间, 这段时间以后，server端就会丢弃这个状态，恢复正常状态

Eventually consistent：数据的最终一致性

基本概念

zookeeper并不是用来存储数据的，通过监控数据状态的变化，达到基于数据的集群管理。

zk是一个典型的分布式协调框架，具有分布式数据一致性的解决方案。它主要用在数据的发布/订阅（配置中心:disconf）、负载均衡（dubbo利用了zookeeper机制实现负载均衡）、命名服务、master选举(kafka、hadoop、hbase)、分布式队列、分布式锁。zookeeper的特性，数据一致性：从同一个客户端发起的事物请求，最终会严格按照顺序应用到zookeeper中，原子性：所有的事务请求的处理结果在整个集群中的所有机器上的应用情况是一致的，也就是说，要么整个集群中的所有机器都成功应用了某一事务、要么全都不应用，可靠性：一旦服务器成功应用了某一个事务数据，并且对客户端做了响应，那么这个数据在整个集群中一定是同步并且保留下来的，实时性：一旦一个事务被成功应用，客户端就能够立即从服务器端读取到事务变更后的最新数据状态；（zookeeper仅仅保证在一定时间内，近实时）。

zookeeper的安装

下载zookeeper ,下载目前版本是3.5.5,下面是基于Linux的安装，可以使用虚拟机，用Xsheel连接，也方便进行集群搭建。

单机搭建

1. 解压zookeeper tar -zxvf zookeeper-3.4.10.tar.gz
1. cd到 ZK_HOME/conf , copy一份zoo.cfg
1. cp zoo_sample.cfg zoo.cfg
1. sh zkServer.sh xxx 查看命令 {start|start-foreground|stop|restart|status|upgrade|print-cmd}
  
  启动命令 sh zkServer.sh start
1. sh zkCli.sh -server ip:port

集群搭建

1：修改zoo.cfg server.id=ip:port:port server.1=192.168..129:2888:3181

2888表示follower节点与leader节点交换信息的端口号 3181 如果leader节点挂掉了, 需要一个端口来重新选举。 server.2=192.168.146.128:2888:3181 server.3=192.168.146.129:2888:3181

2：zoo.cfg中有一个dataDir = /tmp/zookeeper $dataDir/myid 添加一个myid文件。这个myid是用来表示自己服务器在集群中是唯一的。范围是1-255

3：启动服务如果需要增加observer节点 zoo.cfg中增加 ;peerType=observer server.1=192.168.146.128:2888:3181 server.2=192.168.146.129:2888:3181 server.3=192.168.146.130:2888:3181:observer

zookeeper集群, 包含三种角色: leader / follower /observer

observer

observer 是一种特殊的zookeeper节点。可以帮助解决zookeeper的扩展性（如果大量客户端访问我们zookeeper集群，需要增加zookeeper集群机器数量。从而增加zookeeper集群的性能。导致zookeeper写性能下降， zookeeper的数据变更需要半数以上服务器投票通过。造成网络消耗增加投票成本）

1. observer不参与投票。只接收投票结果。
1. 不属于zookeeper的关键部位。

zoo.cfg

tickTime=2000 zookeeper中最小的时间单位长度（ms）
initLimit=10follower节点启动后与leader节点完成数据同步的时间
syncLimit=5leader节点和follower节点进行心跳检测的最大延时时间
dataDir=/tmp/zookeeper表示zookeeper服务器存储快照文件的目录
dataLogDir表示配置 zookeeper事务日志的存储路径，默认指定在dataDir目录下
clientPort表示客户端和服务端建立连接的端口号： 2181

基本模型

zookeeper的数据模型和文件系统类似，每一个节点称为：znode. 是zookeeper中的最小数据单元。每一个znode上都可以保存数据和挂载子节点。从而构成一个层次化的属性结构

节点特性

一般在分布式语境下的节点是指组成集群的每一台服务器，在 zookeeper 中还有另外一层意思，称之为数据节点（ZNode）。 zookeeper 的整个名字空间的结构是层次化的，和 Linux 文件系统结构相似，是一颗树。名字空间的层次由斜杠（/）来进行分割，在名称空间里面的每一个节点的名字空间由这个结点的路径来确定。每个 ZNode 上都会保存自己的数据内容，同时还会保存一系列属性信息。

最低0.47元/天解锁文章

倔强中的小白

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Zookeeper

初识Zookeeper前言现在在分布式当中，基本离不开zookeeper的使用。分布式环境下，主要的特点的分布性、并发性、无序性，自然也会面临一些问题，比如（网络通信：网络本身的不可靠性，因此会涉及到一些网络通信的问题；网络分区：也就是我们通常说的脑裂，当网络发生异常导致分布式系统中部分节点之间的网络延时不断增大，最终导致组成分布式架构的所有节点，只有部分节点能够正常通信；三态：...
复制链接

扫一扫

专栏目录