最近开启了Zabbix监控的告警通知,频繁的收到邮件告警: Zabbix agent on xxx is unreachable for N minutes(xxx为服务器名或者ip地址,N为 相应的trigger中配置的检测时长).
Zabbix版本以及部署如下:
Architech: monitored server(agent) ------ Zabbix Server ------Mysql Database
Version: 3.2.2
zabbix@Zabbix:[/zabbix]$zabbix_server -V
zabbix_server (Zabbix) 3.2.2
针对这个问题,做了如下的测试以及分析.
1 查看告警,几乎所有开启了告警通知的 服务器,均会有unreachable 的告警,但是在此期间,所有服务器提供的服务均正常不间断,无用户反馈问题以及投诉。
2 挑选其中任意一个服务器 执行 长时间 ping 或者多次 telnet 10050(agent端口)均无丢包,端口正常打开。
3 在 zabbix 服务器段执行 模拟 agent.ping 测试 ,返回数据正常.
4 查看 Zabbix server端和 Agent端 日志,发现agent.ping 数据均正常