ZooKeeper TCP连接被防火墙阻断排查过程

0x01 现象

本来正常的Zookeeper选举连接,过一段时间会突然异常,重新选举,查看日志提示连接被Reset掉了。

java.net.SocketException: Connection reset

各个实例的日志都查看了,也没找到异常点。
没办法,只能抓包了。同事使用tcpdump抓了包,使用wireshark打开看了,也没有看到什么异常。正常的连接,会突然收到一个RST包。

本来对ZooKeeper了解不多,但有接触过,也被拉着一起排查。
同事排除了SSL的影响,我一开始的怀疑点是数据包损坏,但数据包损坏的话,应该有重传发生,根据抓的包看,并没有发现重传,这个方向应该不对。

其他可能的原因就只有两个了。

  1. ZooKeeper本身未知的问题;
  2. 某些流量中的pattern触发了网络设备的防护机制。

同事反馈这个环境里的ZooKeeper实例是在同一个二层网络中,也就是说并没有跨网络设备。鉴于1的可能性也比较小,就目前手头有的输入来说,就只有抓到的包,还是按照2的方向排查下。

0x02 IP协议细节

2.1 identity字段

通过对比正常和异常的数据包,发现有以下异常。

正常包的identity字段是逐渐递增的。
而RST的包只有0和固定的23352(经过了修改)。查询资料

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
对于ZooKeeper拒绝连接的问题,可能有几种可能的原因和解决方法。首先,您可以检查以下几点: 1. 检查ZooKeeper服务器是否正在运行:确保ZooKeeper服务器正在运行,并且没有出现任何错误或异常情况。 2. 检查ZooKeeper服务器配置:检查ZooKeeper服务器配置文件(通常是zoo.cfg),确保端口号、主机名和其他相关配置正确。 3. 检查防火墙设置:确保防火墙没有阻止与ZooKeeper服务器之间的连接。您可以尝试临时禁用防火墙,然后再次尝试连接。 4. 检查网络连接:确保您的网络连接正常,并且没有任何网络问题。您可以尝试使用其他网络连接或在不同的网络环境中进行连接。 如果以上方法都没有解决问题,您可以尝试以下进一步的排查步骤: 1. 检查ZooKeeper日志:查看ZooKeeper服务器的日志文件,看是否有任何错误或异常信息。日志文件通常位于ZooKeeper服务器的数据目录下。 2. 检查客户端配置:确保您的客户端配置正确,并且与ZooKeeper服务器的配置相匹配。您可以检查客户端代码或配置文件,确认是否有任何错误或不一致之处。 3. 检查权限设置:检查ZooKeeper服务器和客户端之间的权限设置。确保您具有足够的权限来连接ZooKeeper服务器。您可以尝试使用具有更高权限的用户来进行连接。 如果问题仍然存在,您可以尝试重新启动ZooKeeper服务器,并确保所有依赖项和配置都正确无误。如果问题持续存在,您可以在相应的技术论坛或社区中寻求帮助,以获取更详细的解决方案。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值