Zookeeper安装和使用(Java)

我是咸鱼丶

已于 2022-03-07 10:38:51 修改

阅读量2.3k

点赞数

分类专栏：学习经验文章标签： java zookeeper

于 2022-03-06 15:32:30 首次发布

本文链接：https://blog.csdn.net/wdnmdnm/article/details/123311145

版权

学习经验专栏收录该内容

46 篇文章 3 订阅

订阅专栏

1.1 下载安装

1、环境准备

ZooKeeper服务器是用Java创建的，它运行在JVM之上。需要安装JDK 7或更高版本。

2、上传

将下载的ZooKeeper放到/opt/ZooKeeper目录下

#上传zookeeper alt+p
put f:/setup/apache-zookeeper-3.5.6-bin.tar.gz
#打开 opt目录
cd /opt
#创建zooKeeper目录
mkdir  zooKeeper
#将zookeeper安装包移动到 /opt/zooKeeper
mv apache-zookeeper-3.5.6-bin.tar.gz /opt/zookeeper/

3、解压

将tar包解压到/opt/zookeeper目录下

tar -zxvf apache-ZooKeeper-3.5.6-bin.tar.gz

1.2 配置启动

1、配置zoo.cfg

进入到conf目录拷贝一个zoo_sample.cfg并完成配置

#进入到conf目录
cd /opt/zooKeeper/apache-zooKeeper-3.5.6-bin/conf/
#拷贝
cp  zoo_sample.cfg  zoo.cfg

修改zoo.cfg

#打开目录
cd /opt/zooKeeper/
#创建zooKeeper存储目录
mkdir  zkdata
#修改zoo.cfg
vim /opt/zooKeeper/apache-zooKeeper-3.5.6-bin/conf/zoo.cfg

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-vg3CGpLK-1646551685971)(images\1577548250377.png)]$

修改存储目录：dataDir=/opt/zookeeper/zkdata

2、启动ZooKeeper

cd /opt/zooKeeper/apache-zooKeeper-3.5.6-bin/bin/
#启动
 ./zkServer.sh  start

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5LJKSYlA-1646551685972)(images\1577548052037.png)]$

看到上图表示ZooKeeper成功启动

3、查看ZooKeeper状态

./zkServer.sh status

zookeeper启动成功。standalone代表zk没有搭建集群，现在是单节点

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-1cFU50Dm-1646551685972)(images\1577548175232.png)]$

zookeeper没有启动

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lS8ZqM2C-1646551685972)(images\1577548112773.png)]$

1.3zookeeper 客户端常用命令

连接ZooKeeper服务端

./zkCli.sh –server ip地址:port端口
如果要连接的是本机，则直接./zkCli.sh

断开连接

quit

查看指定的节点下面有哪些子节点

ls /  #查看目录要加/

创建节点

create /节点path value #value是值，可以存值也可以不存

获取节点值

get /节点path

设置节点值

set /节点path value

删除单个节点

delete /节点path

删除带有子节点的节点

deleteall /节点path

创建临时节点

create -e /节点path value  #只要当前回话一断开，下次回话就没有了这个临时节点

创建顺序节点

create -s /节点path value  #这样创建的节点会自动加上顺序编号

创建临时顺序节点

create -es /节点path value

查看节点详细信息

ls –s /节点path

czxid：节点被创建的事务ID 
ctime: 创建时间 
mzxid: 最后一次被更新的事务ID 
mtime: 修改时间 
pzxid：子节点列表最后一次被更新的事务ID
cversion：子节点的版本号 

dataversion：数据版本号 
aclversion：权限版本号 
ephemeralOwner：用于临时节点，代表临时节点的事务ID，如果为持久节点则为0 
dataLength：节点存储的数据的长度 
numChildren：当前节点的子节点个数

2.zookeeper的java客户端库

2.1Curator介绍

Curator 是 Apache ZooKeeper 的Java客户端库。
常见的ZooKeeper Java API ：
原生Java API
ZkClient
Curator
**Curator 项目的目标是简化 ZooKeeper 客户端的使用。**相对于原生的javaAPI
Curator 最初是 Netfix 研发的,后来捐献了 Apache 基金会,目前是 Apache 的顶级项目。
官网：http://curator.apache.org/

注意：使用curator的版本要和zookeeper版本想对应。高版本curator的可以向下兼容。

2.2常用操作

2.2.1建立连接

private CuratorFramework client;
/**
     * 1.建立连接
     * 2.开启连接
     */
    @Before //在其他test方法执行之前执行
    public void testConnect() {

        /**
         * 重试策略，应对连接失败的情况，隔一段时间重试连接一次
         *  @param baseSleepTimeMs 重试之间等待的初始时间，单位是毫秒
         *  @param maxRetries 最大重试次数
         *  重试策略有7种，RetryPolicy有7个实现类
         */
        RetryPolicy retryPolicy = new ExponentialBackoffRetry(3000, 10);

        /**
         * newClient()的四个参数
         * @param connectString       连接字符串。zk server 服务端的地址和端口 "192.168.149.135:2181,192.168.149.136:2181"
         *                            这里可以写集群环境，将来zookeeper会搭建集群，中间用逗号隔开
         * @param sessionTimeoutMs    会话超时时间 单位ms   如果不设置指定值，会有默认值 60*1000
         * @param connectionTimeoutMs 连接超时时间 单位ms   如果不设置指定值，会有默认值 15*1000
         * @param retryPolicy         重试策略，就是当前建立连接超时了、出现错误了，重新连接的策略（一直重试直到连接上、重试连接n次...）
         */
       /*
        //1.第一种方式
        CuratorFramework client = CuratorFrameworkFactory.newClient("192.168.149.135:2181",
                60 * 1000, 15 * 1000, retryPolicy);
        //开启连接
        client.start();
        */

        //2.第二种方式，通过链式编程来建立连接，这种方式比较常用。
        //CuratorFrameworkFactory.builder();
        client = CuratorFrameworkFactory.builder()
                .connectString("192.168.149.135:2181")
                .sessionTimeoutMs(60 * 1000)
                .connectionTimeoutMs(15 * 1000)
                .retryPolicy(retryPolicy)
                .namespace("itheima")//添加名称空间以后，将来所有的操作前面都会给添加一个根目录 /itheima 简化了操作
                .build();

        //开启连接
        client.start();

    }

2.2.2添加节点

/**
     * 创建节点：create 持久 临时 顺序 数据
     * 1. 基本创建 ：create().forPath("")
     *      forPath(String path, byte[] data) throws Exception;
     *      forPath(String path) throws Exception;
     * 2. 创建节点 带有数据:create().forPath("",data)
     * 3. 设置节点的类型：create().withMode().forPath("",data)
     * 4. 创建多级节点  /app1/p1 ：create().creatingParentsIfNeeded().forPath("",data)
     */
    @Test
    public void testCreate() throws Exception {
        //2. 创建节点 带有数据
        //如果创建节点，没有指定数据，则默认将当前客户端的ip作为数据存储
        String path = client.create().forPath("/app2", "hehe".getBytes());
        System.out.println(path);

    }

    @Test
    public void testCreate2() throws Exception {
        //1. 基本创建
        //如果创建节点，没有指定数据，则默认将当前客户端的ip作为数据存储
        String path = client.create().forPath("/app1");
        System.out.println(path);

    }

    @Test
    public void testCreate3() throws Exception {
        //3. 设置节点的类型，withMode()方法
        //如果不指定，默认类型：持久化
     /**持久化节点
     * 当客户端断开连接时，znode 不会被自动删除
     */
    //PERSISTENT (0, false, false),
    /**持久化临时节点
    * 当客户端断开连接时，znode 不会被自动删除，
    * 并且其名称将附加一个单调递增的数字。
    */
    //PERSISTENT_SEQUENTIAL (2, false, true),
    /** 临时节点
     *  znode 将在客户端断开连接时被删除。
     */
    //EPHEMERAL (1, true, false),
    /**临时顺序节点
     * znode 将在客户端断开连接时被删除，
     * 并且其名称将附加一个单调递增的数字。
     */
    //EPHEMERAL_SEQUENTIAL (3, true, true);
        
        String path = client.create().withMode(CreateMode.EPHEMERAL).forPath("/app3");
        System.out.println(path);


    }

    @Test
    public void testCreate4() throws Exception {
        //4. 创建多级节点  /app1/p1
        //creatingParentsIfNeeded():如果父节点不存在，则创建父节点
        String path = client.create().creatingParentsIfNeeded().forPath("/app4/p1");
        System.out.println(path);
    }

2.2.3删除节点

/**
     * 删除节点： delete deleteall
     * 1. 删除单个节点:delete().forPath("/app1");
     * 2. 删除带有子节点的节点:delete().deletingChildrenIfNeeded().forPath("/app1");
     * 3. 必须成功的删除:为了防止网络抖动。本质就是重试。  client.delete().guaranteed().forPath("/app2");
     * 4. 回调：删完之后可以做一些处理	inBackground
     * @throws Exception
     */


    @Test
    public void testDelete() throws Exception {
        // 1. 删除单个节点
        client.delete().forPath("/app1");
    }

    @Test
    public void testDelete2() throws Exception {
        //2. 删除带有子节点的节点
        client.delete().deletingChildrenIfNeeded().forPath("/app4");
    }
    @Test
    public void testDelete3() throws Exception {
        //3. 必须成功的删除
        client.delete().guaranteed().forPath("/app2");
    }

    @Test
    public void testDelete4() throws Exception {
        //4. 回调
        client.delete().guaranteed().inBackground(new BackgroundCallback(){

            @Override
            public void processResult(CuratorFramework client, CuratorEvent event) throws Exception {
                System.out.println("我被删除了~");
                System.out.println(event);
            }
        }).forPath("/app1");
    }

2.2.4修改节点

/**
     * 修改数据
     * 1. 基本修改数据：setData().forPath()
     * 2. 根据版本修改: setData().withVersion().forPath()
     * * version 是通过查询出来的。目的就是为了让其他客户端或者线程不干扰我。（乐观锁）
     *
     * @throws Exception
     */
    @Test
    public void testSet() throws Exception {
        client.setData().forPath("/app1", "itcast".getBytes());
    }


    @Test
    public void testSetForVersion() throws Exception {

        Stat status = new Stat();
        //3. 查询节点状态信息：ls -s
        client.getData().storingStatIn(status).forPath("/app1");


        int version = status.getVersion();//查询出来的 
        System.out.println(version);
        client.setData().withVersion(version).forPath("/app1", "hehe".getBytes());
    }

2.2.5查询节点

 /**
     * 查询节点：
     * 1. 查询数据：get: getData().forPath()
     * 2. 查询子节点： ls: getChildren().forPath()
     * 3. 查询节点状态信息：ls -s:getData().storingStatIn(状态对象).forPath()
     */

    @Test
    public void testGet1() throws Exception {
        //1. 查询数据：get
        byte[] data = client.getData().forPath("/app1");
        System.out.println(new String(data));
    }

    @Test
    public void testGet2() throws Exception {
        // 2. 查询子节点： ls
        List<String> path = client.getChildren().forPath("/");

        System.out.println(path);
    }

    @Test
    public void testGet3() throws Exception {


        Stat status = new Stat();
        System.out.println(status);
        //3. 查询节点状态信息：ls -s
        client.getData().storingStatIn(status).forPath("/app1");

        System.out.println(status);

    }

3.Watch事件监听

ZooKeeper 允许用户在指定节点上注册一些Watcher，并且在一些特定事件触发的时候，ZooKeeper 服务端会将事件通知到感兴趣的客户端上去，该机制是 ZooKeeper 实现分布式协调服务的重要特性。
ZooKeeper 中引入了Watcher机制来实现了发布/订阅功能，能够让多个订阅者同时监听某一个对象，当一个对象自身状态变化时，会通知所有订阅者。
ZooKeeper 原生支持通过注册Watcher来进行事件监听，但是其使用并不是特别方便，需要开发人员自己反复注册Watcher，比较繁琐。
Curator引入了 Cache 来实现对 ZooKeeper 服务端事件的监听。
ZooKeeper提供了三种Watcher：
NodeCache : 只是监听某一个特定的节点
PathChildrenCache : 监控一个ZNode的子节点.
TreeCache : 可以监控整个树上的所有节点，类似于PathChildrenCache和NodeCache的组合

3.1建立连接

    private CuratorFramework client;

    /**
     * 开启事件监听前要建立连接
     */
    @Before
    public void testConnect() {

        /*
         *
         * @param connectString       连接字符串。zk server 地址和端口 "192.168.149.135:2181,192.168.149.136:2181"
         * @param sessionTimeoutMs    会话超时时间 单位ms
         * @param connectionTimeoutMs 连接超时时间 单位ms
         * @param retryPolicy         重试策略
         */
       /* //重试策略
        RetryPolicy retryPolicy = new ExponentialBackoffRetry(3000,10);
        //1.第一种方式
        CuratorFramework client = CuratorFrameworkFactory.newClient("192.168.149.135:2181",
                60 * 1000, 15 * 1000, retryPolicy);*/
        //重试策略
        RetryPolicy retryPolicy = new ExponentialBackoffRetry(3000, 10);
        //2.第二种方式
        //CuratorFrameworkFactory.builder();
        client = CuratorFrameworkFactory.builder()
                .connectString("192.168.149.135:2181")
                .sessionTimeoutMs(60 * 1000)
                .connectionTimeoutMs(15 * 1000)
                .retryPolicy(retryPolicy)
                .namespace("itheima")
                .build();

        //开启连接
        client.start();

    }

    @After
    public void close() {
        if (client != null) {
            client.close();
        }
    }

3.2 给指定一个节点注册监听器

/**
     * 演示 NodeCache：给指定一个节点注册监听器
     * 1. 创建NodeCache对象
     * 2. 注册监听
     * 3. 开启监听
     */

    @Test
    public void testNodeCache() throws Exception {
        //1. 创建NodeCache对象
        final NodeCache nodeCache = new NodeCache(client,"/app1");
        //2. 注册监听,getListenable().addListener(new NodeCacheListener(){})
        nodeCache.getListenable().addListener(new NodeCacheListener() {
            @Override
            public void nodeChanged() throws Exception {
                System.out.println("节点变化了~");

                //获取修改节点后的数据
                byte[] data = nodeCache.getCurrentData().getData();
                System.out.println("修改后的内容："+new String(data));
            }
        });

        //3. 开启监听.如果设置为true，则开启监听时，加载缓冲数据，也就是传入true参数，所以能够直接得到当前节点的内容
        nodeCache.start(true);

        //加个死循环，单机测试一下
        while (true){

        }
    }

3.3监听某个节点的所有子节点们

/**
     * 演示 PathChildrenCache：监听某个节点的所有子节点们
     * 1.创建监听对象
     * 2. 绑定监听器
     * 3. 开启监听
     */

    @Test
    public void testPathChildrenCache() throws Exception {
        //1.创建监听对象
        PathChildrenCache pathChildrenCache = new PathChildrenCache(client,"/app2",true);
        /**
         * public PathChildrenCache(CuratorFramework client, String path, boolean cacheData)
         * @param client    the client
         * @param path      path to watch
         * @param cacheData 如果为 true，除了状态之外，还会缓存节点内容
         */

        //2. 绑定监听器，getListenable().addListener(new PathChildrenCacheListener(){})
        pathChildrenCache.getListenable().addListener(new PathChildrenCacheListener() {
            @Override
            public void childEvent(CuratorFramework client, PathChildrenCacheEvent event) throws Exception {
                System.out.println("子节点变化了~");
                System.out.println(event);//事件对象
                //监听子节点的数据变更，并且拿到变更后的数据
                //1.获取类型
                PathChildrenCacheEvent.Type type = event.getType();
                //2.判断类型是否是update（子节点内容被修改）
                if(type.equals(PathChildrenCacheEvent.Type.CHILD_UPDATED)){
                    System.out.println("数据变了！！！");
                    byte[] data = event.getData().getData();
                    System.out.println(new String(data));
                }
            }
        });
        //3. 开启
        pathChildrenCache.start();

        while (true){

        }
    }

3.4 监听某个节点自己和所有子节点们

/**
     * 演示 TreeCache：监听某个节点自己和所有子节点们
     */

    @Test
    public void testTreeCache() throws Exception {
        //1. 创建监听器
        TreeCache treeCache = new TreeCache(client,"/app2");

        //2. 注册监听，getListenable().addListener(new TreeCacheListener() {})
        treeCache.getListenable().addListener(new TreeCacheListener() {
            @Override
            public void childEvent(CuratorFramework client, TreeCacheEvent event) throws Exception {
                System.out.println("节点变化了");
                System.out.println(event);
            }
        });

        //3. 开启
        treeCache.start();

        while (true){

        }
    }

4.分布式锁实现

在我们进行单机应用开发，涉及并发同步的时候，我们往往采用synchronized或者Lock的方式来解决多线程间的代码同步问题，这时多线程的运行都是在同一个JVM之下，没有任何问题。
但当我们的应用是分布式集群工作的情况下，属于多JVM下的工作环境，跨JVM之间已经无法通过多线程的锁解决同步问题。
那么就需要一种更加高级的锁机制，来处理种跨机器的进程之间的数据同步问题——这就是分布式锁。资源在哪里，分布式锁就加到哪里。

分布式锁实现的三种方式：基于缓存实现分布式锁（Redis，Memcahce）；zookeeper实现分布式锁；数据库层面实现分布式锁（悲观锁、乐观锁）

基于缓存实现，效率高但是不可靠。redis集群化以后可能存在某个节点挂掉然后导致多个jvm都获取到了锁。

zookeeper实现效率相对比较高且最为可靠

数据库实现效率低下

4.1实现原理

核心思想：当客户端要获取锁，则创建节点，使用完锁，则删除该节点。
客户端获取锁时，在lock节点下创建临时顺序节点。（lock节点名字无所谓，想叫啥叫啥）
然后获取lock下面的所有子节点，客户端获取到所有的子节点之后，如果发现自己创建的子节点序号最小，那么就认为该客户端获取到了锁。使用完锁后，将该节点删除。
如果发现自己创建的节点并非lock所有子节点中最小的，说明自己还没有获取到锁，此时客户端需要找到比自己小的那个节点，同时对其注册事件监听器，监听删除事件。
如果发现比自己小的那个节点被删除，则客户端的
Watcher会收到相应通知，此时再次判断自己创建的节点
是否是lock子节点中序号最小的，如果是则获取到了锁，
如果不是则重复以上步骤继续获取到比自己小的一个节点
并注册监听。

4.2 ZooKeeper JavaAPI操作，模拟12306售票

在Curator中有五种锁方案：
InterProcessSemaphoreMutex：分布式排它锁（非可重入锁）
InterProcessMutex：分布式可重入排它锁
InterProcessReadWriteLock：分布式读写锁
InterProcessMultiLock：将多个锁作为单个实体管理的容器
InterProcessSemaphoreV2：共享信号量

public class LockTest {


    public static void main(String[] args) {
        Ticket12306 ticket12306 = new Ticket12306();

        //创建客户端
        Thread t1 = new Thread(ticket12306,"携程");//用线程来模拟买票的人
        Thread t2 = new Thread(ticket12306,"飞猪");

        t1.start();
        t2.start();
    }

}

/**
 * 没有多态机器来部署，使用多线程来模拟
 * 实现Runnable接口，重写run方法
 */
public class Ticket12306 implements Runnable{

    private int tickets = 10;//数据库的票数

    private InterProcessMutex lock ;//分布式可重入排它锁

    /**
     * 重写构造方法，建立连接，并加个锁
     */
    public Ticket12306(){
        //重试策略
        RetryPolicy retryPolicy = new ExponentialBackoffRetry(3000, 10);
        //2.第二种方式
        //CuratorFrameworkFactory.builder();
        CuratorFramework client = CuratorFrameworkFactory.builder()
                .connectString("192.168.149.135:2181")
                .sessionTimeoutMs(60 * 1000)
                .connectionTimeoutMs(15 * 1000)
                .retryPolicy(retryPolicy)
                .build();

        //开启连接
        client.start();

        /**
         * @param client client
         * @param path   the path to lock
         */
        lock = new InterProcessMutex(client,"/lock");
    }

    @Override
    public void run() {

        while(true){
            //获取锁
            try {
                /**
                 * @param time time to wait
                 * @param unit time unit
                 */
                lock.acquire(3, TimeUnit.SECONDS);//获取锁
                if(tickets > 0){
                    //看看是哪个线程来买的票
                    System.out.println(Thread.currentThread()+":"+tickets);
                    Thread.sleep(100);
                    tickets--;
                }
            } catch (Exception e) {
                e.printStackTrace();
            }finally {
                //释放锁
                try {
                    lock.release();//释放锁
                } catch (Exception e) {
                    e.printStackTrace();
                }
            }
        }
    }
}

5.搭建Zookeeper集群

Zookeeper 集群介绍

Leader选举：
Serverid：服务器ID
比如有三台服务器，编号分别是1,2,3。
编号越大在选择算法中的权重越大。
Zxid：数据ID
服务器中存放的最大数据ID.值越大说明数据越新，在选举算法中数据越新权重越大。
在Leader选举的过程中，如果某台ZooKeeper
获得了超过半数的选票，
则此ZooKeeper就可以成为Leader了。Leader选举出来以后，再有新机器加入进来，Leader也不会变化，除非挂掉了

1.1 搭建要求

真实的集群是需要部署在不同的服务器上的，但是在我们测试时同时启动很多个虚拟机内存会吃不消，所以我们通常会搭建伪集群，也就是把所有的服务都搭建在一台虚拟机上，用端口进行区分。

我们这里要求搭建一个三个节点的Zookeeper集群（伪集群）。

1.2 准备工作

重新部署一台虚拟机作为我们搭建集群的测试服务器。

（1）安装JDK 【此步骤省略】。

（2）Zookeeper压缩包上传到服务器
（3）将Zookeeper解压，建立/usr/local/zookeeper-cluster目录，将解压后的Zookeeper复制到以下三个目录

/usr/local/zookeeper-cluster/zookeeper-1

/usr/local/zookeeper-cluster/zookeeper-2

/usr/local/zookeeper-cluster/zookeeper-3

[root@localhost ~]# mkdir /usr/local/zookeeper-cluster
[root@localhost ~]# cp -r  apache-zookeeper-3.5.6-bin /usr/local/zookeeper-cluster/zookeeper-1
[root@localhost ~]# cp -r  apache-zookeeper-3.5.6-bin /usr/local/zookeeper-cluster/zookeeper-2
[root@localhost ~]# cp -r  apache-zookeeper-3.5.6-bin /usr/local/zookeeper-cluster/zookeeper-3

（4）创建data目录，并且将 conf下zoo_sample.cfg 文件改名为 zoo.cfg

mkdir /usr/local/zookeeper-cluster/zookeeper-1/data
mkdir /usr/local/zookeeper-cluster/zookeeper-2/data
mkdir /usr/local/zookeeper-cluster/zookeeper-3/data

mv  /usr/local/zookeeper-cluster/zookeeper-1/conf/zoo_sample.cfg  /usr/local/zookeeper-cluster/zookeeper-1/conf/zoo.cfg
mv  /usr/local/zookeeper-cluster/zookeeper-2/conf/zoo_sample.cfg  /usr/local/zookeeper-cluster/zookeeper-2/conf/zoo.cfg
mv  /usr/local/zookeeper-cluster/zookeeper-3/conf/zoo_sample.cfg  /usr/local/zookeeper-cluster/zookeeper-3/conf/zoo.cfg

（5）配置每一个Zookeeper 的dataDir 和 clientPort 分别为2181 2182 2183

修改/usr/local/zookeeper-cluster/zookeeper-1/conf/zoo.cfg

vim /usr/local/zookeeper-cluster/zookeeper-1/conf/zoo.cfg

clientPort=2181
dataDir=/usr/local/zookeeper-cluster/zookeeper-1/data

修改/usr/local/zookeeper-cluster/zookeeper-2/conf/zoo.cfg

vim /usr/local/zookeeper-cluster/zookeeper-2/conf/zoo.cfg

clientPort=2182
dataDir=/usr/local/zookeeper-cluster/zookeeper-2/data

修改/usr/local/zookeeper-cluster/zookeeper-3/conf/zoo.cfg

vim /usr/local/zookeeper-cluster/zookeeper-3/conf/zoo.cfg

clientPort=2183
dataDir=/usr/local/zookeeper-cluster/zookeeper-3/data

1.3 配置集群

（1）在每个zookeeper的 data 目录下创建一个 myid 文件，内容分别是1、2、3 。这个文件就是记录每个服务器的ID

echo 1 >/usr/local/zookeeper-cluster/zookeeper-1/data/myid
echo 2 >/usr/local/zookeeper-cluster/zookeeper-2/data/myid
echo 3 >/usr/local/zookeeper-cluster/zookeeper-3/data/myid

（2）在每一个zookeeper 的 zoo.cfg配置客户端访问端口（clientPort）和集群服务器IP列表。

集群服务器IP列表如下

vim /usr/local/zookeeper-cluster/zookeeper-1/conf/zoo.cfg
vim /usr/local/zookeeper-cluster/zookeeper-2/conf/zoo.cfg
vim /usr/local/zookeeper-cluster/zookeeper-3/conf/zoo.cfg

server.1=192.168.149.135:2881:3881
server.2=192.168.149.135:2882:3882
server.3=192.168.149.135:2883:3883

解释：server.服务器ID=服务器IP地址：服务器之间通信端口：服务器之间投票选举端口

1.4 启动集群

启动集群就是分别启动每个实例。

/usr/local/zookeeper-cluster/zookeeper-1/bin/zkServer.sh start
/usr/local/zookeeper-cluster/zookeeper-2/bin/zkServer.sh start
/usr/local/zookeeper-cluster/zookeeper-3/bin/zkServer.sh start

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-dDk5Pg5P-1646620181198)(images/wps11.jpg)]

启动后我们查询一下每个实例的运行状态

/usr/local/zookeeper-cluster/zookeeper-1/bin/zkServer.sh status
/usr/local/zookeeper-cluster/zookeeper-2/bin/zkServer.sh status
/usr/local/zookeeper-cluster/zookeeper-3/bin/zkServer.sh status

先查询第一个服务

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0BstGsac-1646620181199)(images\wps12.jpg)]$

Mode为follower表示是跟随者（从）

再查询第二个服务Mod 为leader表示是领导者（主）

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-x2UcVyYF-1646620181199)(images/\wps13.jpg)]$

查询第三个为跟随者（从）

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CTCoaKcj-1646620181200)(images/\wps14.jpg)]$

1.5 模拟集群异常

（1）首先我们先测试如果是从服务器挂掉，会怎么样

把3号服务器停掉，观察1号和2号，发现状态并没有变化

/usr/local/zookeeper-cluster/zookeeper-3/bin/zkServer.sh stop

/usr/local/zookeeper-cluster/zookeeper-1/bin/zkServer.sh status
/usr/local/zookeeper-cluster/zookeeper-2/bin/zkServer.sh status

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-rlDNQnz9-1646620181200)(images/\wps15.jpg)]$

由此得出结论，3个节点的集群，从服务器挂掉，集群正常

（2）我们再把1号服务器（从服务器）也停掉，查看2号（主服务器）的状态，发现已经停止运行了。

/usr/local/zookeeper-cluster/zookeeper-1/bin/zkServer.sh stop

/usr/local/zookeeper-cluster/zookeeper-2/bin/zkServer.sh status

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-PTbDOycR-1646620181200)(images/\wps16.jpg)]$

由此得出结论，3个节点的集群，2个从服务器都挂掉，主服务器也无法运行。因为可运行的机器没有超过集群总数量的半数。

（3）我们再次把1号服务器启动起来，发现2号服务器又开始正常工作了。而且依然是领导者。

/usr/local/zookeeper-cluster/zookeeper-1/bin/zkServer.sh start

/usr/local/zookeeper-cluster/zookeeper-2/bin/zkServer.sh status

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ytuIAaQK-1646620181200)(images/\wps17.jpg)]$

（4）我们把3号服务器也启动起来，把2号服务器停掉,停掉后观察1号和3号的状态。

/usr/local/zookeeper-cluster/zookeeper-3/bin/zkServer.sh start
/usr/local/zookeeper-cluster/zookeeper-2/bin/zkServer.sh stop

/usr/local/zookeeper-cluster/zookeeper-1/bin/zkServer.sh status
/usr/local/zookeeper-cluster/zookeeper-3/bin/zkServer.sh status

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-7tmsQhM6-1646620181201)(images/\wps18.jpg)]$

发现新的leader产生了~

由此我们得出结论，当集群中的主服务器挂了，集群中的其他服务器会自动进行选举状态，然后产生新得leader

（5）我们再次测试，当我们把2号服务器重新启动起来启动后，会发生什么？2号服务器会再次成为新的领导吗？我们看结果

/usr/local/zookeeper-cluster/zookeeper-2/bin/zkServer.sh start

/usr/local/zookeeper-cluster/zookeeper-2/bin/zkServer.sh status
/usr/local/zookeeper-cluster/zookeeper-3/bin/zkServer.sh status

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-eW6CqLpU-1646620181201)(images/\wps19.jpg)]$
$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-jjJ2FNiF-1646620181201)(images/\wps20.jpg)]$

我们会发现，2号服务器启动后依然是跟随者（从服务器），3号服务器依然是领导者（主服务器），没有撼动3号服务器的领导地位。

由此我们得出结论，当领导者产生后，再次有新服务器加入集群，不会影响到现任领导者。

1.6 Zookeeper 集群角色

在ZooKeeper集群服中务中有三个角色：
Leader 领导者：处理事务请求（增删改），集群内部各服务器的调度者
Follower 跟随者：处理客户端非事务请求（查询），转发事务请求给Leader服务器，参与Leader选举投票

Observer 观察者：处理客户端非事务请求，转发事务请求给Leader服务器

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3ZcoKIiS-1646620181202)(E:\百度网盘\网盘下载\第4阶段—中间键&服务框架\1、微服务SpringCloud+RabbitMQ+Docker+Redis+搜索\实用篇\day03-Docker\讲义\assets\image-20220307102334549.png)]$