linux系统脚本执行日志,Shell 脚本实战:日志关键字监控+自动告警

导读

该程序使用场景说明:主要用于Linux服务器监控程序日志,如出现关键字异常则触发相应的动作或告警操作,通知到邮件联系人。

一、安装邮件服务

1、解压

tar -jxf mailx-12.4.tar.bz2 -C /usr/src/ && cd /usr/src/mailx-12.4/

2、编译

make install UCBINSTALL=/usr/bin/install

9c70907a9831f5a570d49e2323f4eb2d.png

异常报错解决方法

下载mailx补丁文件“mailx-12.4-openssl_1.0.0_build_fix-1.patch”,将补丁文件和mailx解压缩目录放置同一路径

15b9bf866be4d62e1a326d42e8ae6565.png

执行打补丁命令:

patch -p0 < mailx-12.4-openssl_1.0.0_build_fix-1.patch

4148e5de4dbba8dbbd1d7455c91a419c.png

进入mailx-12.4重新执行编译命令:

make install UCBINSTALL=/usr/bin/install

10abce4ada05a7a95d59df09da0328eb.png

检测mailx是否安装成功:mailx -V

0b7a61fd5dbe9a94d7cec216a3a1e4da.png

3、配置

vi /etc/nail.rc,在文件的最后添加

set from=

set smtp=

set smtp-auth-user=

set smtp-auth-password=

set smtp-auth=login

如下图所示,修改配置完后保存

7cc8cda59a3c56d8cce48695d1b6697d.png

4、测试发送邮件

echo '邮件正文'|mailx -v -s "邮件标题" 邮箱地址

e48d604ff5a1996b07517cff6eb9d7d2.png

至此邮件功能测试正常,接下来是关键字监控脚本的编写工作,通过日志关键字脚本触发邮件告警脚本实现日志监控

二、关键字监控脚本开发

CheckLogs.sh 日志监控程序

SendMail.sh 发邮件脚本,该脚本可自定义

conf 配置文件目录,chklist为配置文件

1886dd5cd8ab8357813d91b429c32906.png

初次执行CheckLogs.sh脚本会读取日志文件并记录当前读取的行数

8ea6167df9ad1a629491f36f88b9d118.png

后续运行脚本则读取更新日志,例如当前日志更新了9行数据,则脚本从最新的9行数据获取关键字

3b7bed42a4a5dcd83b67f2d0b2daa458.png

测试插入关键字error

66e9e7baf9e182a0e5d5f27d00b1f626.png

继续执行脚本可以看到已捕获关键字并触发告警

1d10c4e450ad38dc2f801f730a3e875b.png

测试多关键字

39b2299edd25d97cd31ac1287f3126a2.png

再次执行可以看到已捕获最新更新的日志信息

a41e2df0f58dd97a6aabb376317ed4e5.png

测试频率控制

af0269902b970351f837aee60bbe91e7.png

至此相关功能测试已完成。最后附上脚本相关代码如下:

#!/bin/bash

basedir=$(cd `dirname "$0"`;pwd)

logsdir=$basedir/logs

tmpsdir=$basedir/tmps

confdir=$basedir/conf

chkfile=$confdir/chklist

logfile=$logsdir/log.log_$(date +%F)

#创建各种目录

mkdir -p $logsdir $tmpsdir $confdir

#创建配置文件

if test ! -e "$chkfile";then

echo "#日志文件,关键字(多关键字|隔开),重试次数,最大执行次数,启动命令,停止命令" >$chkfile

fi

#生成日志函数

do_writelog() {

case $1 in

i|I)

shift

echo "$(date +%Y-%m-%d) $(date +%H:%M:%S)|INFO|$@" >>$logfile

;;

e|E)

shift

echo "$(date +%Y-%m-%d) $(date +%H:%M:%S)|ERROR|$@" >>$logfile

;;

w|W)

shift

echo "$(date +%Y-%m-%d) $(date +%H:%M:%S)|WARNING|$@" >>$logfile

;;

*)

echo "$(date +%Y-%m-%d) $(date +%H:%M:%S)|DEBUG|$@" >>$logfile

esac

}

#日志处理部分代码

cat $chkfile|egrep -v "^($|#)"|while read i;do

(

app_name=$(echo "$i"|awk -F, '{print $1}')

if test -z "$app_name";then

do_writelog e "应用名称为空,退出执行"

exit 0

fi

log_filename=$(echo "$i"|awk -F, '{print $2}')

if test ! -e "$log_filename";then

do_writelog e "日志文件($log_filename)不存在,退出执行"

exit 0

fi

log_md5sum=$(echo -n "$log_filename"|md5sum|awk '{print $1}')

log_gjz=$(echo "$i"|awk -F, '{print $3}')

if test -z "$log_gjz";then

do_writelog i "日志文件($log_filename),关键字为空,退出执行"

exit 0

fi

log_retry=$(echo "$i"|awk -F, '{print $4}')

expr $log_retry + 0 &>/dev/null

if [ $? -ne 0 ];then

log_retry=0

fi

log_max=$(echo "$i"|awk -F, '{print $5}')

expr $log_max + 0 &>/dev/null

if [ $? -ne 0 ];then

log_max=3

fi

start_command=$(echo "$i"|awk -F, '{print $6}')

stops_command=$(echo "$i"|awk -F, '{print $7}')

open_sendmail=$(echo "$i"|awk -F, '{print $8}')

mail_scripts=$(echo "$i"|awk -F, '{print $9}')

mail_contacts=$(echo "$i"|awk -F, '{print $10}')

if [ $open_sendmail -eq 1 ];then

if test -z "$mail_scripts";then

do_writelog i "应用($app_name),触发动作脚本为空,退出执行"

exit 0

fi

if test -z "$mail_contacts";then

do_writelog i "应用($app_name),联系人为空,退出执行"

exit 0

fi

fi

if test ! -e "$tmpsdir/$log_md5sum";then

log_new_count=$(wc -l $log_filename|awk '{print $1}')

echo "$log_new_count" >$tmpsdir/$log_md5sum

do_writelog i "日志文件($log_filename),初始化读取日志行数:$log_new_count,退出执行"

else

log_old_count=$(cat $tmpsdir/$log_md5sum)

expr $log_old_count + 0 &>/dev/null

if [ $? -ne 0 ];then

do_writelog e "日志文件($log_filename),读取历史行数失败,退出执行"

exit 0

fi

log_new_count=$(wc -l $log_filename|awk '{print $1}')

if [ $log_new_count -eq $log_old_count ];then

do_writelog i "日志文件($log_filename),未更新,退出执行"

exit 0

elif [ $log_new_count -lt $log_old_count ];then

do_writelog i "日志文件($log_filename),跨日更新日志行数:$log_new_count,退出执行"

echo "$log_new_count" >$tmpsdir/$log_md5sum

else

log_upd_count=$(expr $log_new_count - $log_old_count)

do_writelog i "日志文件($log_filename),历史行数:$log_old_count,最新行数:$log_new_count,更新行数:$log_upd_count"

#读取更新的日志

log_content=$(tail -n +`expr $log_old_count + 1` $log_filename|head -n +$log_upd_count)

oldIFS=$IFS

IFS="|"

count=0

for i in $log_gjz;do

if [ $(echo "$log_content"|grep -c -w "$i") -ge 1 ];then

let count+=1

fi

if [ $count -gt 0 ];then

break

fi

done

IFS=$oldIFS

if [ $count -gt 0 ];then

echo "0" >>$tmpsdir/${log_md5sum}.retry

else

do_writelog i "日志文件($log_filename),未获取到关键字,退出执行"

echo "$log_new_count" >$tmpsdir/$log_md5sum

exit 0

fi

if [[ $(wc -l $tmpsdir/${log_md5sum}.retry|awk '{print $1}') -gt $log_retry ]];then

echo "0" >>$tmpsdir/${log_md5sum}_$(date +%F)

if [ $(wc -l $tmpsdir/${log_md5sum}_$(date +%F)|awk '{print $1}') -le $log_max ];then

$stops_command 1>>$logfile 2>&1

$start_command 1>>$logfile 2>&1

do_writelog i "日志文件($log_filename),日志内容:$log_content,找到关键字:$i,停止命令:$stops_command,启动命令:$start_command,重启服务"

if [ $open_sendmail -eq 1 ];then

if test -n "$mail_scripts";then

$mail_scripts "应用[$app_name]故障" "日志文件($log_filename),日志内容:$log_content,找到关键字:$i" "$mail_contacts" 1>>$logfile 2>&1

if [ $? -ne 0 ];then

do_writelog i "日志文件($log_filename),日志内容:$log_content,找到关键字:$i,触发告警失败"

fi

do_writelog i "日志文件($log_filename),日志内容:$log_content,找到关键字:$i,触发告警通知联系人:[$mail_contacts]"

fi

else

do_writelog i "日志文件($log_filename),日志内容:$log_content,找到关键字:$i,不触发告警"

fi

else

do_writelog i "日志文件($log_filename),日志内容:$log_content,找到关键字:$i,重启服务超出当天限制次数:$log_max,退出执行"

fi

rm -f $tmpsdir/${log_md5sum}.retry &>/dev/null

else

do_writelog i "日志文件($log_filename),日志内容:$log_content,找到关键字:$i,重试检测:$(wc -l $tmpsdir/${log_md5sum}.retry|awk '{print $1}')"

fi

echo "$log_new_count" >$tmpsdir/$log_md5sum

do_writelog i "日志文件($log_filename),更新记次文件完成"

fi

fi

)&

done

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值