实用 Java微服务随机掉线排查思路解析

本文讲述了作者在排查Java微服务集群中遇到的随机服务掉线问题,从服务器资源、网络、Nacos集群等多个角度进行深入分析。经过一系列的跟踪和测试,最终发现是由于Linux内核的BUG导致服务假死,通过升级内核解决问题,揭示了系统级问题对应用运行的影响。
摘要由CSDN通过智能技术生成

背景

  • 我们的业务共使用11台(阿里云)服务器,使用SpringcloudAlibaba构建微服务集群,共计60个微服务,全部注册在同一个Nacos集群
  • 流量转发路径: nginx->spring-gateway->业务微服务
  • 使用的版本如下:
    spring-boot.version:2.2.5.RELEASE
    spring-cloud.version:Hoxton.SR3
    spring-cloud-alibaba.version:2.2.1.RELEASE
    java.version:1.8

案发

  • 春节放假期间,收到反馈,网页报错服务未找到(gateway找不到服务的报错提示).
  • 查看nacos集群列表,发现个别服务丢失(下线).
  • 这个问题每几天出现一次,出现时间不固定,每次掉线的服务像是随机选的几个.
  • 服务手动kill+restart后能稳定运行2-3天

排查和解决

怀疑对象一:服务器内存爆了

1.进阿里云控制台查看故障机器近期的各项指标,但是发现故障机器的指标有重要的几项丢失,内存使用率,cpu使用率,系统负载均不显示

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值