java服务宕机 定时任务_一个定时任务导致的业务频繁宕机事故

现象和背景:

最近,一个客户的mongodb经常发生内存不足的情况,由于对业务也未产生太大影响,也没有太多关注。然而近期业务发生频繁宕机,尤其近日,发生宕机的概率越来越大,一天宕机次数达7、8次之多,虽然每次仅有一分钟故障时间,但整体影响还是不小。

历史处理方式:

通过对java内存的监控,调整gc策略稍有所缓解,又对JVM整体内存进行调整,从原先的3G调整为7G,仍无法解决问题。后同事对该业务增加了定时监测应用接口的功能,如发现业务接口宕机,就自动重启Java应用。常说“重启是万能的”,却发现在这个业务场景下,重启就显得无能为力。

分析:

1、首先查看主机监控(从内存、CPU、流量、IO、TCP等角度综合分析),通过监控图的查看,我们发现异常时间时,Java应用主机的流量比较高。

2、流量高的几个原因,一个是外部用户访问量(或攻击类)的增加,从而导致应用主机流量增加,另一个是内部功能调用,应用主机与其他某些业务之间有关联,从而导致流量增加。经过仔细分析后,我们排除了外部用户量增加或者被攻击的情况。然后我们筛选了所有服务器的近3个小时的网络流量,发现mongodb和另一个业务的流量很高。

22aa6cee46bfe076134c1d2c5deb67d6.png

3、跟客户沟通后,排出了另一个业务流量高导致当前应用主机异常的可

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值