告警系统邮件引擎&运行告警系统

20.23/20.24/20.25 告警系统邮件引擎

告警邮件引擎的核心,conf主配置文件调用到的都是mail.sh 告警邮件引擎的核心需要定义调用mail.py的sh脚本,因为之前做zabbix的时候,做过mail.py的脚本,在这里,直接调用进行使用就可以。

mail.sh目的是做告警收敛,如果不想做告警收敛,在发现问题的时候直接告警就好,但是,可能会发生1分钟前发现问题,1分钟后问题解决,这样就会变成误报,这样告警的意义会降低,收敛的目的就是1分钟前发现问题,然后到10分钟后,服务还没有恢复,就会告诉管理人员10分钟了服务还未恢复,可以看做是一个告警的延迟判断或缓冲

编写mail.sh

mail.py内容,mail.sh用于调用mail.py以及做告警邮件的收敛

#!/bin/bash

log=$1   
t_s=`date +%s`
t_s2=`date -d "2 hours ago" +%s`  ##定义2个小时的时间戳
#日志不存在就创建日志
if [ ! -f /tmp/$log ]
then
    echo $t_s2 > /tmp/$log
fi

#下面这段,等同于一个计时器

t_s2=`tail -1 /tmp/$log|awk '{print $1}'`
echo $t_s>>/tmp/$log
v=$[$t_s-$t_s2]   ##时间戳对比
echo $v

#当故障存在3600秒,就会进行告警

if [ $v -gt 3600 ]
then
    ./mail.py  $1  $2  $3
    echo "0" > /tmp/$log.txt  ##等同于计数器
else
    if [ ! -f /tmp/$log.txt ]
    then
        echo "0" > /tmp/$log.txt
    fi
    nu=`cat /tmp/$log.txt`
    nu2=$[$nu+1]
    echo $nu2>/tmp/$log.txt
    if [ $nu2 -gt 10 ]
    then
         ./mail.py  $1 "trouble continue 10 min $2" "$3"
         echo "0" > /tmp/$log.txt   ##邮件告警结束以后,重新开始计数
    fi
fi  

该脚本运用于,间隔3600秒的故障;10分钟内故障;间歇性故障;

核心的判断:计时、计数

20.26 运行告警系统

因为告警系统的作用是监控系统的负载等各项服务器功能的使用情况,所以执行告警系统,需要每分钟执行一次

crontab -e     ##创建任务计划(每分钟执行一次)
* * * * * cd /usr/local/sbin/mon/bin ; bahs main.sh

注:监控发送邮件的部分,尽量少用空格,因为mail.py发送邮件是以空格来定义三个参数的

定义好计划以后,重启计划,查看load的检测值是否为0

转载于:https://my.oschina.net/u/3804357/blog/1859141

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值