Zookeeper学习

1. Zookeeper入门

1.1 概述

        Zookeeper 是一个开源的分布式的,为分布式应用提供协调服务的Apache项目.
在这里插入图片描述

1.2 特点

在这里插入图片描述

  1. Zookeeper: 一个领导者(Leader),多个跟随者(Follower)组成的集群.
  2. 集群中只要有半数以上的节点存活,Zookeeper集群就能正常服务.
  3. 全局数据一致: 每个Server保存一份相同的数据副本,Client无论连接到哪个Server,数据都是一致的.
  4. 更新请求顺序进行, 来自同一个Client的更新请求按其发送顺序依次执行.
  5. 数据更新的原子性, 一次数据更新要么成功,要么失败.
  6. 实时性,在一定时间范围内,Client能读到最新的数据.

1.3 Zookeeper的数据结构

        Zookeeper数据模型的结果与Unix文件系统很类似,整体上可以看做是一颗树,每个节点称作一个ZNode. 每一个ZNode默认能存储1MB的数据,每个ZNode都可以通过其路径唯一标识.
在这里插入图片描述

1.4 应用场景

  Zookeeper是一个经典的分布式数据一致性解决方案,致力于为分布式应用提供一个高性能,高可用,且具有严格顺序访问控制能力的分布式协调存储服务.
        提供的服务包括: 统一命名服务, 统一配置管理, 统一集群管理, 服务器节点动态上下线, 软负载均衡,分布式锁服务等.
统一命名服务
在这里插入图片描述
统一配置管理
在这里插入图片描述
统一集群管理
在这里插入图片描述

服务器动态上下线
在这里插入图片描述
软负载均衡
        在Zookeeper中记录每台服务器的访问数,让访问数最少的服务器去处理最新的客户端请求.
在这里插入图片描述

1.5 下载地址

官网首页
https://zookeeper.apache.org/
下载地址
https://zookeeper.apache.org/releases.html#download

2. Zookeeper安装

2.1 云服务安装部署

1. 安装前准备
  (1) 安装jdk
  (2) 将Zookeeper安装包上传到Linux系统下
  (3) 解压到指定目录

tar -zxvf zookeeper-3.4.9.tar.gz -C /opt/module/

2. 配置修改
  (1) 将/opt/module/zookeeper-3.4.9/conf 这个路径下的zoo_sample.cfg重命名为zoo.cfg.

mv zoo_sample.cfg zoo.cfg

  (2) 打开zoo.cfg文件,修改dataDir路径

 vim zoo.cfg 

修改内容如下:
dataDir=/opt/module/zookeeper-3.4.9/zkData

  (3) 在/opt/module/zookeeper-3.4.9/这个目录下创建zkData文件夹

 mkdir zkData

3. 操作Zookeeper

  (1) 启动Zookeeper

bin/zkServer.sh start

  (2) 查看进程是否启动

jps

  (3) 查看状态

bin/zkServer.sh status

  (4) 启动客户端

bin/zkCli.sh

  (5) 退出客户端

quit

  (6) 退出Zookeeper服务

 bin/zkServer.sh stop

2.2 配置参数解读

配置文件如下:

# The number of milliseconds of each tick
tickTime=2000  
# The number of ticks that the initial 
# synchronization phase can take
initLimit=10
# The number of ticks that can pass between 
# sending a request and getting an acknowledgement
syncLimit=5
# the directory where the snapshot is stored.
# do not use /tmp for storage, /tmp here is just 
# example sakes.
dataDir=/opt/module/zookeeper-3.4.9/zkData
# the port at which the clients will connect
clientPort=2181
# the maximum number of client connections.
# increase this if you need to handle more clients
#maxClientCnxns=60
#
# Be sure to read the maintenance section of the 
# administrator guide before turning on autopurge.
#
# http://zookeeper.apache.org/doc/current/zookeeperAdmin.html#sc_maintenance
#
# The number of snapshots to retain in dataDir
#autopurge.snapRetainCount=3
# Purge task interval in hours
# Set to "0" to disable auto purge feature
#autopurge.purgeInterval=1

Zookeeper中的配置文件zoo.cfg中参数含义解读如下:

  1. tickTime=2000: 通信心跳数,Zookeeper服务器与客户端心跳时间,单位毫秒.
            Zookeeper使用的基本时间,服务器之间或客户端与服务器之间维持心跳的时间间隔,也就是每个tickTime时间会发送一个心跳.
            它用于心跳机制,并且设置最小的session超时时间为两倍心跳时间.

  2. initLimit=10: LF初始通信时限
            集群中的Follower(跟随者)服务器与Leader(领导者)服务器之间初始连接时能容忍的最多心跳数,用它来限定集群中的Follower服务器连接到Leader服务器的时限.(这里是10*2,也就是20秒)

  3. syncLimit=5: LF同步通信时限
            集群中的Follower服务器与Leader服务器之间的最大响应时间单位,假如响应超过syncLimit*tickTime(10秒),Leader认为Follower挂掉,从服务器列表中删除Follower.

  4. dataDir:数据文件目录+数据持久化路径
    主要用于保存Zookeeper中的数据.

  5. clientPort=2181:客户端连接端口
    监听客户端连接端口.

3. Zookeeper内部原理

3.1 选举机制

  • 半数机制:集群中半数以上的服务器存活,集群可用.所以Zookeeper适合安装奇数台服务器.
  • Zookeeper虽然在配置文件中并没有指定Master和Slave.但是,Zookeeper工作时,是有一个节点为Leader,其他则为Follower,Leader是通过内部选举机制临时产生的.
  • 以一个简单的例子来说明整个选举过程.
            假设有五台服务器组成的Zookeeper集群,他们的id从1-5,同时它们都是最新启动的,也就是没有历史数据,在存放数据量这一点上是一样的.假设这些服务器依次启动,来看看会发生什么:
    在这里插入图片描述
  • 服务器1启动,给自己投票,然后发投票信息,由于其它机器还没有启动所以它收不到反馈信息,服务器1的状态一直属于Looking(选举状态)。
  • 服务器2启动,给自己投票,同时与之前启动的服务器1交换结果,由于服务器2的编号大所以服务器2胜出,但此时投票数没有大于半数,所以两个服务器的状态依然是LOOKING。
  • 服务器3启动,给自己投票,同时与之前启动的服务器1,2交换信息,由于服务器3的编号最大所以服务器3胜出,此时投票数正好大于半数,所以服务器3成为领导者,服务器1,2成为小弟。
  • 服务器4启动,给自己投票,同时与之前启动的服务器1,2,3交换信息,尽管服务器4的编号大,但之前服务器3已经胜出,所以服务器4只能成为小弟。
  • 服务器5启动,后面的逻辑同服务器4成为小弟。

3.2 节点类型

节点类型

  • 短暂(ephemeral):客户端和服务器端断开连接后,创建的节点自己删除.
  • 持久(persistent):客户端和服务器端断开连接后,创建的节点不删除

Znode有四种形式的目录节点(默认是persistent )

  • 持久化目录节点(PERSISTENT)客户端与zookeeper断开连接后,该节点依旧存在
  • 持久化顺序编号目录节点(PERSISTENT_SEQUENTIAL) 客户端与zookeeper断开连接后,该节点依旧存在,只是Zookeeper给该节点名称进行顺序编号
  • 临时目录节点(EPHEMERAL)客户端与zookeeper断开连接后,该节点被删除
  • 临时顺序编号目录节点(EPHEMERAL_SEQUENTIAL)客户端与zookeeper断开连接后,该节点被删除,只是Zookeeper给该节点名称进行顺序编号

在这里插入图片描述
创建znode时设置顺序标识,znode名称后会附加一个值,顺序号是一个单调递增的计数器,由父节点维护
在分布式系统中,顺序号可以被用于为所有的事件进行全局排序,这样客户端可以通过顺序号推断事件的顺序

3.3 Stat结构体

[zk: localhost:2181(CONNECTED) 1] get /

cZxid = 0x0
ctime = Thu Jan 01 08:00:00 CST 1970
mZxid = 0x0
mtime = Thu Jan 01 08:00:00 CST 1970
pZxid = 0x6
cversion = 0
dataVersion = 0
aclVersion = 0
ephemeralOwner = 0x0
dataLength = 0
numChildren = 2
1)czxid- 引起这个znode创建的zxid,创建节点的事务的zxid

2)ctime - znode被创建的毫秒数(从1970年开始)

3)mzxid - znode最后更新的zxid

4)mtime - znode最后修改的毫秒数(从1970年开始)

5)pZxid-znode最后更新的子节点zxid

6)cversion - znode子节点变化号,znode子节点修改次数

7)dataversion - znode数据变化号

8)aclVersion - znode访问控制列表的变化号

9)ephemeralOwner- 如果是临时节点,这个是znode拥有者的session id。如果不是临时节点则是0

10)dataLength- znode的数据长度

11)numChildren - znode子节点数量

3.4 监听器原理(面试重点)

监听器原理分析
1. 首先需要一个main 主线程
2. 在main线程中创建一个zookeeper客户端,这时候就会创建两个线程,一个负责网络链接通信(connect),一个负责监听(listener)
3. 通过connect线程将注册的监听事件发给zookeeper
4. 在zookeeper的注册监听器列表中将注册的监听事件添加到列表中
5. zookeeper监听到有数据或路径变化,就会将这个消息发送给listener 线程
6. listener 线程内部调用了process() 方法
在这里插入图片描述
常用的监听

  1. 监听节点数据变化

    get path [watch]
    
  2. 监听子节点增减变化

    ls path [watch]
    

3.5 写数据流程

在这里插入图片描述

4. Zookeeper实战(开发重点)

4.1 分布式安装部署

https://www.cnblogs.com/ysocean/p/9860529.html

4.2 客户端命令行操作

https://blog.csdn.net/u012387141/article/details/105387838/
在这里插入图片描述

4.3 API应用

4.3.1 IDEA环境搭建

  1. 创建一个Maven工程
  2. 添加pom依赖
        <dependency>
            <groupId>org.apache.zookeeper</groupId>
            <artifactId>zookeeper</artifactId>
            <version>3.4.6</version>
        </dependency>
        
    	<dependency>
            <groupId>org.apache.logging.log4j</groupId>
            <artifactId>log4j-core</artifactId>
            <version>2.8.2</version>
        </dependency>
        
        <dependency>
            <groupId>junit</groupId>
            <artifactId>junit</artifactId>
            <version>4.12</version>
        </dependency>
    
  3. 拷贝log4j.properties文件到项目根目录
      需要在项目的src/main/resources目录下,新建一个文件,命名为“log4j.properties”,在文件中填入。
log4j.rootLogger=INFO, stdout  
log4j.appender.stdout=org.apache.log4j.ConsoleAppender  
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout  
log4j.appender.stdout.layout.ConversionPattern=%d %p [%c] - %m%n
log4j.appender.logfile=org.apache.log4j.FileAppender  
log4j.appender.logfile.File=target/spring.log  
log4j.appender.logfile.layout=org.apache.log4j.PatternLayout  
log4j.appender.logfile.layout.ConversionPattern=%d %p [%c] - %m%n  

4.3.2 创建Zookeeper客户端

package com.newland;

import org.apache.zookeeper.*;
import org.apache.zookeeper.data.Stat;
import org.junit.After;
import org.junit.Before;
import org.junit.Test;

import java.io.IOException;
import java.util.List;

/**
 * @author 张宝奎
 * @date 2021/2/22
 */
public class ZkClientTest {
    private String connectString = "192.168.44.128:2181,192.168.44.128:2182,192.168.44.128:2183";
    private int sessionTimeout = 20000;
    private ZooKeeper zkClient;

    @Before
    public void init() throws IOException {
        zkClient= new ZooKeeper(connectString, sessionTimeout, new Watcher() {
            @Override
            当Server端口的Node发生改变那么Server就会将该事件通知Client,那么Client就会调用此方法
            public void process(WatchedEvent watchedEvent) {
                //在此方法中写收到监听事件后需要做的操作
                List<String> children = null;
                try {
                    System.out.println("=============start=============");
                    children = zkClient.getChildren("/new", true);

                for (String child : children) {
                    //输出子节点信息
                    System.out.println(child);
                }
                    System.out.println("=============end===============");
                } catch (KeeperException e) {
                    e.printStackTrace();
                } catch (InterruptedException e) {
                    e.printStackTrace();
                }
            }
        });
    }
    @After
    public void after() throws InterruptedException {
        zkClient.close();
    }

    //创建节点
    @Test
    public void createNode() throws KeeperException, InterruptedException {
        /**
         * 参数1: 节点路径
         * 参数2: 节点数据
         * 参数3: 访问控制权限
         * 参数4: 目录节点的类型
         */
        String path = zkClient.create("/new", "jack".getBytes(), ZooDefs.Ids.OPEN_ACL_UNSAFE, CreateMode.PERSISTENT);
        System.out.println(path);
    }

    /**
     * 获取子节点并监听
     */
    @Test
    public void test2() throws KeeperException, InterruptedException {
        /*
         getChildren(final String path, Watcher watcher)
         第一个参数:节点路径
         第二个参数:监听器对象
         */
        List<String> children = zkClient.getChildren("/new", true);

        for (String child : children) {
            //输出子节点信息
            System.out.println(child);
        }

        //不能让主线程死掉,监听线程需要一直运行
        Thread.sleep(Long.MAX_VALUE);

    }


    /**
     * 查看节点状态 - 判断节点是否存在
     */
    @Test
    public void test3() throws KeeperException, InterruptedException {
        /*
            exists(String path, boolean watch)
            第一个参数 :节点的路径
            第二个参数 : 是否使用总监听对象(new Zookeeper时创建的监听对象)
                不用监听。
            注意:如果返回值为null则表示节点不存在
         */
        Stat exists = zkClient.exists("/nl", false);

        if (exists == null){
            System.out.println("节点不存在");
        }else {
            System.out.println("节点存在");
        }

    }

}

5.企业面试真题

5.1 请简述Zookeeper的选举机制

详见3.1

5.2 Zookeeper的监听原理是什么

详见3.4

5.3 Zookeeper的部署方式有哪几种?集群中的角色有哪些?集群最少需要几台机器?

  1. 单机模式 集群模式
  2. 角色: Leader和Follower
  3. 集群最少需要的机器数: 3

5.4 Zookeeper的常用命令

ls create get delete set…

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值