【一篇入魂】Zookeeper入门看这篇就够了

1.ZooKeeper

1.1. ZooKeeper 概述

Zookeeper 是一个分布式协调服务的开源框架。主要用来解决分布式集群中应用系统的一致性问题,例如怎样避免同时操作同一数据造成脏读的问题。
ZooKeeper 本质上是一个分布式的小文件存储系统。提供基于类似于文件系统的目录树方式的数据存储,并且可以对树中的节点进行有效管理。从而用来维 护和监控你存储的数据的状态变化。通过监控这些数据状态的变化,从而可以达 到基于数据的集群管理。诸如:统一命名服务、分布式配置管理、分布式消息队列、分布式锁、分布式协调等功能

1.2. ZooKeeper 特性

全局数据一致、可靠性、顺序性、数据更新原子性、实时性

1.3. ZooKeeper 集群角色

在这里插入图片描述

  • Leader:事务请求(写操作)的唯一调度和处理者,集群内部各个服务器的调度者。
  • Follower: 处理客户端非事务(读操作)请求,转发事务请求给 Leader; 参与集群 Leader 选举投票。
    此外,针对访问量比较大的 zookeeper 集群,还可新增观察者角色。
  • Observer:观察 Zookeeper 集群的最新状态变化并将这些状态同步过来。

1.4. ZooKeeper 集群搭建

1.4.1.安装

zookeeper 集群搭建指的是 ZooKeeper 分布式模式安装。通常由2n+1台 servers 组成。这是因为为了保证 Leader 选举(基于 Paxos 算法的实现)能过得到多数的支持,所以 ZooKeeper 集群的数量一般为奇数。

Zookeeper 运行需要 java 环境,所以需要提前安装 jdk,然后下载Zookeeper🔗点击跳转
下载并解压ZooKeeper软件压缩包后,可以看到zk包含以下的文件和目录:在这里插入图片描述

  • bin目录:zk的可执行脚本目录,包括zk服务进程,zk客户端,等脚本。其中,.sh是Linux环境下的脚本,.cmd是Windows环境下的脚本。
  • conf目录:配置文件目录。zoo_sample.cfg为样例配置文件,需要修改为自己的名称,一般为zoo.cfg。log4j.properties为日志配置文件。
  • lib:zk依赖的包。
  • contrib目录:一些用于操作zk的工具包。
  • recipes目录:zk某些用法的代码示例。
    如果要想使用 Observer 模式,可在对应节点的配置文件添加如下配置:
    peerType=observer
    其次,必须在配置文件指定哪些节点被指定为 Observer,如:
    server.1:localhost:2181:3181:observer

1.4.2.单机模式

ZooKeeper的安装包括单机模式安装,以及集群模式安装。
上面提到,conf目录下提供了配置的样例zoo_sample.cfg,要将zk运行起来,需要将其名称修改为zoo.cfg

单机模式较简单,是指只部署一个zk进程,客户端直接与该zk进程进行通信。
在开发测试环境下,通过来说没有较多的物理资源,因此我们常使用单机模式。当然在单台物理机上也可以部署集群模式,但这会增加单台物理机的资源消耗。故在开发环境中,我们一般使用单机模式。
但是要注意,生产环境下不可用单机模式,这是由于无论从系统可靠性还是读写性能,单机模式都不能满足生产的需求。

1.4.2.1.启动

在Windows环境下,直接双击zkServer.cmd即可。
在Linux环境下,进入bin目录,执行命令

./zkServer.sh start

这个命令使得zk服务进程在后台进行。如果想在前台中运行以便查看服务器进程的输出日志,可以通过以下命令运行:

./zkServer.sh start-foreground

执行此命令,可以看到大量详细信息的输出,以便允许查看服务器发生了什么。

使用文本编辑器打开zkServer.cmd或者zkServer.sh文件,可以看到其会调用zkEnv.cmd或者zkEnv.sh脚本。zkEnv脚本的作用是设置zk运行的一些环境变量,例如配置文件的位置和名称等。
假如启动遇到了一些问题,请点击此处!

1.4.2.3 连接

如果是连接同一台主机上的zk进程,那么直接运行bin/目录下的zkCli.cmd(Windows环境下)或者zkCli.sh(Linux环境下),即可连接上zk。
直接执行zkCli.cmd或者zkCli.sh命令默认以主机号 127.0.0.1,端口号 2181 来连接zk,如果要连接不同机器上的zk,可以使用 -server 参数,例如:

bin/zkCli.sh -server 10.10.10.100:2181

1.4.3.集群模式

单机模式的zk进程虽然便于开发与测试,但并不适合在生产环境使用。在生产环境下,我们需要使用集群模式来对zk进行部署。

1.4.3.1.启动

假如我们打算在三台不同的机器 10.10.10.100,10.10.10.120,10.10.10.10058上各部署一个zk进程,以构成一个zk集群。
三个zk进程均使用相同的 zoo.cfg 配置

tickTime=2000
dataDir=/home/myname/zookeeper
clientPort=2181
initLimit=5
syncLimit=2
server.1=10.10.10.100:2888:3888
server.2=10.10.10.120:2888:3888
server.3=10.10.10.58:2888:3888

在三台机器dataDir目录( /home/myname/zookeeper 目录)下,分别生成一个myid文件,其内容分别为1,2,3。然后分别在这三台机器上启动zk进程,这样我们便将zk集群启动了起来。

1.4.3.2.连接

可以使用以下命令来连接一个zk集群:

bin/zkCli.sh -server 10.10.10.100:2181,10.10.10.120:2181,10.10.10.58:2181

成功连接后,可以看到控制台日志输出。

2.数据模型

2.1. ZooKeeper 数据模型

采用树形层次结构,ZooKeeper 树中的每个节点被称为— Znode,和文件系统的目录树一样,ZooKeeper 树中的每个节点可以拥有子节点。 但也有不同之处:

  1. Znode 兼具文件和目录两种特点
  2. Znode 具有原子性操作
  3. Znode 存储数据大小有限制
  4. Znode 通过路径引用(路径必须是绝对的)

2.2. 数据结构图

Alt
图中的每个节点称为一个 Znode。 每个 Znode 由 3 部分组成:

  • 1 stat:此为状态信息, 描述该 Znode 的版本, 权限等信息
  • 2 data:与该 Znode 关联的数据
  • 3 children:该 Znode 下的子节点

2.3. 节点类型

Znode 有两种,分别为临时节点永久节点。 节点的类型在创建时即被确定,并且不能改变。
临时节点:该节点的生命周期依赖于创建它们的会话。一旦会话结束,临时节点将被自动删除,当然可以也可以手动删除。临时节点不允许拥有子节点。
永久节点:该节点的生命周期不依赖于会话,并且

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值