Zookeeper 扩展之殇

本文讲述了在公司服务器迁移过程中,Zookeeper集群遇到的问题及解决过程。在迁移Zookeeper到新环境中,启动后发现状态报错。经过排查,问题可能涉及配置文件、防火墙、端口占用等多个方面。通过分析shell脚本,找到导致错误的端口号配置异常,并修复后成功解决集群异常,确保了业务不受影响。
摘要由CSDN通过智能技术生成

一、背景

基于公司发展硬性需求,生产VM服务器要统一迁移到ZStack 虚拟化服务器。检查自己项目使用的服务器,其中zookeeper集群中招,所以需要进行迁移。

二、迁移计划

为了使迁移不对业务产生影响,所以最好是采用扩容 -> 缩容 的方式进行。

zk

说明:
1.原生产集群为VM-1,VM-2,VM-3组成一个3节点的ZK集群;
2.对该集群扩容,增加至6节点(新增ZS-1,ZS-2,ZS-3),进行数据同步完成;
3.进行缩容,下掉原先来的三个节点(VM-1,VM-2,VM-3);
4.替换nginx解析地址。

OK! 目标很明确,过程也很清晰,然后开干。

三、步骤 (过程已在测试环境验证无问题):

  1. 对新增的三台服务器进行zk环境配置,和老集群配置一样即可,最好使用同一版本(版主使用的是3.4.6);

  2. 对老节点的zoo.cfg 增加新集群的地址(逐一增加),然后对新增加节点逐一重启。

zk-2

四、问题

[root@localhost bin]# ./zkServer.sh  status
ZooKeeper JMX enabled by default
Using config: /usr/zookeeper/zookeeper-3.4.6/bin/../conf/zoo.cfg
Error contacting service. It is probably not running.

  • 此时查看数据,数据同步正常
ZS-1 数据同步正常,但是无法查看节点的状态信息;
  • 怀疑是因为老节点没有重启的原因;此时去查看原集群节点信息,发现原集群节点状态异常。经排查定位,原集群的状态一直处于异常状态。

  • 初步定位原因可能是原集群的选举存在异常,导致新节点无法正常纳入,继续排查。

  • 恢复集群初始状态,如果集群节点的状态一直没法正常查看。OK 继续定位…

五、排查过程

以下方法来自于网络:

可能有以下几个原因:

第一、zoo.cfg文件配置:dataLogDir指定的目录未被创建。</

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值