一、简介
当zabbix监控的主服务器上的服务停止,则切换到Linux备服务,保证业务的正常访问。
在监控平台上做相应的告警动作通知和远程启动备机服务启动程序命令,当检测到问题时由监控系统完成切换启动程序操作。
二、实现过程
监控到主服务器服务或者操作系统死了,发出告警
启动备机服务
当监控主服务器服务恢复,发出恢复告警通知
人员检查确认恢复,手动关闭备机服务
告警发送及远程启动服务
发送恢复告警通知
判断服务宕机可通过判断agent客户端 + ICMP方式,首先判断agent客户端在一定时间范围内没有采集到数据,且主机IP不能被采集服务器Ping通,则判断主机宕机。
判断服务程序在设定的时间范围内没有采集到数据且远程访问的8080端口不通,则判定程序停止运行,才能触发告警动作和远程启动备机服务命令或脚本。
为免网络问题发生误告警误触发远程命令等情况,可设置触发器的时间或次数进行逻辑判断,例如:监控项的更新间隔为1m(分钟),触发器设置连续检查3次,只有当3次都没有检查到数据时才发送告警通知并执行远程命令。
博客可能不能及时回复问题,技术问题欢迎加入交流;
博主具有丰富的模板开发和模板资源及项目管理经验分享欢迎加入交流;
微信号:king_songax