遇到一个奇葩问题,nagios监控windows下面的cpu服务项出现如下警告信息:(但是其他服务项状态Ok,且此警告信息过一会 自动会恢复Ok状态 再过一段时间 又会变成如下图中的警告信息状态warning)

wKioL1P26aaBsBkPAAFxRhd8r2w723.jpgwKioL1P26cbhlaPYAACBHT2zHWI873.jpg

解决思路:

第一 : 排查造成此情况的原因:

  1. Nsclient++版本原因  ( 经排查同样版本的服务器CPU监控项没出现此问题故  排除)

  2. Nsclient++服务重启  ( 经观察 不是此处故障)

  3. 更换CPU监控方式: ( 由 check_nt命令检测改为snmp检测。最终解决此问题)

    第一步: 编写snmp方式监控CPU的脚本并放在如下目录:

    wKioL1P266jD3C8_AARMNLo5luk988.jpg第二步 :在command.conf文件中进行定义:

    wKioL1P268rQhpJaAADFUED1URA804.jpg

    第三步: 定义服务监控项:

    wKioL1P26_GRQfHEAAH-D6p8Lbo846.jpg

  4. 配置好以上步骤,重启nagios服务器即可。

遇到nagios报警如下图所示现象:

wKioL1P27GOiobzUAAFAJMO2U3s182.jpg

分析: 可能是/var/empty/sshd目录权限问题

如果可以ssh登录服务器,那么在服务器上执行如下命令查看/var/empty/sshd目录权限是否为744

如果不是的话更改为744即可。

wKioL1P27S_ihy2qAABUUTkNH-0994.jpg