Shell脚本实现对服务器的监控并通过邮件进行告警

#!/bin/bash

# "/etc/mail.rc"  文件中添加邮箱的信息
# set from=123456@qq.com
# set smtp=smtp.qq.com
# set smtp-auth-user=123456@qq.com
# set smtp-auth-password=yourpasswd
# set smtp-auth=login

server_ip=`/usr/sbin/ip a | awk '/inet / {print $2}'|sed '2p' -n` #不要127的ip取第一个ip就可以了
time_now=`date +%F" "%H:%M`

send_mail () {
cat <<EOF | mail -s "服务器告警" 123456@qq.com
    主机IP: $server_ip
    ${1}状态异常:
    $2
    请上线查看处理!
    $time_now
EOF
}

service_check () { 
   system_service=(
        nginx
        mysql
        tomcat
        php
        firewalld
   )

   failed_services=() 
   #数组接受失败的服务 不会一个服务发一条邮件 组合发送节约资源
   for i in ${system_service[*]};
   do
      server_status=`ps -ef |grep $i |grep -Ev "$0|grep" |wc -l`
      if [ $server_status -eq 0 ];
      then
        failed_services+=($i",")
      fi
   done
    send_mail "系统服务" `printf '%s' "${failed_services[@]}"`
}

java_check () {
   jar_files=(
       'Example1.jar'
       'Example2.jar'
       'Example3.jar'
   )
   #变量接受的模式 将失败的服务循环赋值给$jar_failed
   jar_failed=""
   for i in ${jar_files[*]};
   do
      java_status=`ps -ef |grep $i |grep -Ev "$0|grep" |wc -l`
      if [ $java_status -eq 0 ];
      then
        jar_failed="$jar_failed$i",""
      fi
   done
   send_mail "java" "$jar_failed"
}

disk_check () {
   # 磁盘检测
   # 磁盘检测阈值定义(不要写单位)
   disk_threshold='70'
   # 
   disk_name=`df -h |awk -F"[ %]+" -v i=$disk_threshold '/^\/dev/{if($5>=i)printf"%s,",$1}'` 
   #printf"%s,",$1  --> markdown格式不认识空格用格式化输出为字符串用","作为多个磁盘的分隔符
   if [ ! -z $disk_name ];
   then
      send_mail "系统" "${disk_name}使用率已经超过${disk_threshold}%"
   fi
} 

cpu_check () {
   cpu_use=`top -bn1 | grep "Cpu(s)" | awk '{print $2 + $4}' |awk -F"[.]" '{print $1}'`
   if [ $cpu_use -ge 70 ];
   then
      send_mail "系统" "Cpu使用率飙高已用${cpu_use}"%"" "请上线查看处理"
   fi
}


service_check
java_check
disk_check
cpu_check

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,下面是Shell脚本+钉钉机器人实现服务及服务器监控告警的步骤: 1. 创建一个Shell脚本,用于监控服务器或服务的运行状态,比如检查CPU、内存、硬盘使用情况、网络连接等。 2. 在Shell脚本中,使用curl命令调用钉钉机器人接口,将告警信息发送到指定的钉钉群中。比如: ``` #!/bin/bash # 获取CPU使用率 cpu_usage=$(top -b -n1 | grep "Cpu(s)" | awk '{print $2+$4}') # 获取内存使用率 mem_usage=$(free | awk '/Mem/{printf("%.2f"), $3/$2*100}') # 获取硬盘使用率 disk_usage=$(df -h | awk '$NF=="/"{printf "%s", $5}') # 获取网络连接数 net_conn=$(netstat -an | grep ESTABLISHED | wc -l) # 配置钉钉机器人URL和access_token url="https://oapi.dingtalk.com/robot/send?access_token=your_access_token" # 组装告警消息 msg="服务器告警:\nCPU使用率:${cpu_usage}%\n内存使用率:${mem_usage}%\n硬盘使用率:${disk_usage}\n当前连接数:${net_conn}" # 发送告警消息到钉钉群 curl -H "Content-Type: application/json" -d "{\"msgtype\": \"text\", \"text\": {\"content\": \"${msg}\"}}" ${url} ``` 3. 在服务器上设置定时任务,定期执行Shell脚本,比如每5分钟执行一次。可以使用crontab命令设置定时任务,比如: ``` */5 * * * * /path/to/your/script.sh ``` 4. 在钉钉群中添加机器人,并获取机器人的access_token。 5. 将access_token替换到Shell脚本中的url参数中,然后保存Shell脚本。 6. 等待定时任务执行,当服务器或服务的运行状态异常时,Shell脚本会自动发送告警消息到钉钉群中。 以上就是使用Shell脚本+钉钉机器人实现服务及服务器监控告警的步骤。通过这种方式,可以及时发现服务器或服务的运行异常,避免出现更大的问题。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值