- 一大早到了公司,打开邮箱注意到一个报警。一开始, 还真不清楚这个的意思,于是进一步发掘zabbix里面关于该条报警的一些内容。
按照1 2 3的顺序,可以找到该指标
可以看到当前页面已经显示了一条报警,点击组态可以找到监控该指标的信息。有下面第二张图可以看出,是关于某个端口的closewait状态的。
- 登录服务器查看,确实close wait不少。由于该app部署在两台机器上,所以查看第二台服务器,没有发现类似问题。
总结该问题
- CLOSE-WAIT超过100
- CPU超过80%
参考
后续跟进排查 cpu从周日上午10点开始长期居于80%以上