一次现网java服务的故障处理

接到报警,发现已经不能从redis读取数据,后台日志发现线程池占满,然后进行处理,现网重启,重启脚本dump出相关的现场日志。

 

分析:

1、查看free的输出信息,发现正常

2、查看gc的输出和heap的输出,也很正常

3、查看netstat的tcp连接,发现连接一个服务地址A连接特别多,怀疑这个上面有问题

4、查看jstack的输出,发现服务地址A上请求的线程都处于RUNNABLE状态,总数和线程池总线程一样,进一步分析,发现阻塞在接收数据响应上。至此真相大白,集成第三的服务的时候,默认超时时间设置过长,在并发量大的情况下+后然服务提供长时间未响应,导致连接被占用

等待的位置为:java.net.SocketInputStream.socketRead0(Native Method)

 

解决方法:操作时间设置的短点,提供保护,最终的解决方案还是服务方提供更快的处理能力。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小小她爹

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值