运维软件:zabbix 采集方式:snmp 采集设备:惠普-DL380_Gen9-服务器 采集周期:根据指标要求频率有5分钟到1天 主要命令: reset /map1 snmp采集惠普服务器一段时间后,zabbix提示连接失败,重启ilo后又可以重新采集,我们可以利用这一点做一个自动重启脚本,保证采集正常。 实现思路:zabbix检查自定时间内没有数据->触发告警脚本->告警脚本登录设备执行 reset /map1 1.我们要模板里加一个多久没有采集到数据的触发器如: 2.增加报警媒介。 管理->报警媒介类型->创建报警媒介类型。 脚本的操作是根据传过来的参数到数据库是找出此设备管理口IP、帐号、密码。主要sql:SELECT i.ip,h.ipmi_username,h.ipmi_password from `hosts` as h LEFT JOIN interface as i on i.hostid = h.hostid where h.host="'.$hostName.'" and i.port= 161。 然后用ssh连接到该设备,执行 reset /map1 就可以重启该ilo了。 3.添加动作 配置->动作->创建动作 到此重启设备ilo口完成。 面对snmp频繁采集导致snmp连接失败,这也是一个解决方案。 |
-
-
-
原文地址
-
解决方案 ——惠普服务器SNMP采集频繁导致服务停止
-
http://www.lwops.cn/forum.php?mod=viewthread&tid=68
-
(出处: 乐维_一站式运维监控管理平台)
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/31561206/viewspace-2284175/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/31561206/viewspace-2284175/