问题说明:Zabbix agent主动模式获取不到数据
排查过程:
1、查看agent配置文件(Hostname、ServerActive配置均正确)
2、查看zabbix agent日志发现大量连接超时与连接失败,但是查看系统资源使用率正常、磁盘空间使用也正常。
3、查看server日志,发现大量重复的“first network error”错误信息,根据错误信息,初步怀疑为被监控主机网络上出现的问题。
4、进入被监控主机,经过多次排查,使用命令:netstat -nao | find /c "TIME_WAIT" 查看到"TIME_WAIT"占用大量的端口未释放,可初步断定为此问题
5、
http://support.microsoft.com/kb/2553549
这个问题原因是windows2008R2的bug。当Windows2008R2系统运行时间超过497天,TCP/IP的网络资源(端口)就不会再自动释放,在运行一段时间后,本机的网络资源就会被全部用光。这样就会造成系统中任何需要网络资源的组件都无法正常工作。
问题解决:
重启机器或打补丁修复改bug