服务器宕机监控、检测、报警程序（139绑定手机短信报警）monitor_down.sh

最新推荐文章于 2023-03-30 15:16:35 发布

kyrin_云中鹤

最新推荐文章于 2023-03-30 15:16:35 发布

阅读量3k

点赞数

分类专栏： linux 文章标签： linux

linux 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

宕机监控报警程序

一. 需求来源

宕机对运维人员来说，最痛苦了。如何检测一台服务器是否还在正常运行，如果该服务器宕机，如何在第一时间监测到并通知一线运维人员进行维护，最大化减少损失。

二. 程序功能

对指定服务器进行宕机监测，如果确实宕机，则发送email到139邮箱(绑定手机，实现短信报警)

三.源程序

#!/bin/bash
#author         longxibendi
#blog           http://blog.csdn.net/longxibendi
#function       ping  a  host   and   output  to  file     ping_longxibendi.log
#ping  destination
function_ping ()
{
 ping  -c 3     172.29.141.115  >  ping_longxibendi.log
}
#downtime detection and  send email to   SA
function_downtime_detection_AND_sendemail ()
{
         if  [ "`cat ping_longxibendi.log | grep Unreachable`"  !=  ""    ] ; then
                /usr/local/bin/sendEmail -f monitor_sys@163.com -t longxibendi@139.com -s smtp.163.com -u "Server downtime" -xu monitor_sys -xp 123456789 -m "`date;echo "172.29.141.115" ` "
         fi
}
#main function
function_main ()
{
while    true
do
        function_ping ;
        sleep   2
        function_downtime_detection_AND_sendemail ;
        sleep  2

done
}
function_main ;

四.程序说明

1.通过 function_ping ，每隔4秒对主机 172.29.141.115 进行ping 操作，(当然，如果主机172.29.141.115的防火墙，或者内过滤ICMP包，那么这个程序显然不能用)将输出重定向到ping_longxibendi.log 文件中

2.通过 function_downtime_detection_AND_sendemail ，每隔4秒，通过ping_longxibendi.log判断是否有没有ping通的迹象，如果有，则调用 sendEmail 邮件(手机短信)报警。

3.监控间隔时间说明，可以将第一个 sleep 改为 150 ，第二个 sleep 改为 150 ，这样每隔5分钟监控一次。

四.使用环境说明

1.主机 A(172.29.141.112) 主机B (172.29.141.115) ，

在A上部署该监控程序(monitor_down.sh)，用于监控B

2.正常情况下A能ping通B

因为用的ping命令，所以如果使用该程序，需要在正常情况下A ping 通 B 。对企业来说，这可能就需要防火墙和Linux内核参数(当然，如果之前没有修改net.ipv4.icmp_echo_ignore_all，则不需要调整)

3.安装了 sendEmail 并在139邮箱注册(绑定手机)，方可有邮件(短信)报警提示

五.程序测试

[root@localhost monitor]# sh monitor_down.sh