背景: 生产上突然发现 mysql 的某个VIP 地址,同网段的机器正常访问,另外一个网端内的机器无法连接,导致现网故障…..
解决方法: 此次故障运维侧没有及时发现故障,导致故障时间长达10分钟,影响了现网用户的使用,后排查是网络出现了问题,为了下次快速的发现故障,现将zabbix 上添加不同网段主机对数据库 VIP 端口的监控
工具: zabbix
监控内容: tcp 监控远程 VIP 192.168.202.108 3306 端口
监控项名称:MYSQL-VIP 192.168.202.108:3306 (XX项目mysql)
监控项: net.tcp.port[192.168.202.108,3306] 使用zabbix 自带的键值
触发器名称:MYSQL-VIP 192.168.202.108:3306 (XX项目mysql) 丢失
触发器: {192.168.207.172:net.tcp.port[192.168.202.108,3306].count(#3,1,”ne”)}>2
#连续检测3次有2次以上的结果不等于1 则告警
触发器: {192.168.207.172:net.tcp.port[192.168.202.108,3306].count(#3,1,"ne")}>2