Linux编写脚本监控系统负载,shell脚本: linux系统的负载与CPU、内存、硬盘、用户数监控...

最新推荐文章于 2023-06-21 22:11:23 发布

葵烟

最新推荐文章于 2023-06-21 22:11:23 发布

阅读量524

点赞数

文章标签： Linux编写脚本监控系统负载

利用

这几天在学习研究shell脚本，写的一些系统负载、CPU、内存、硬盘、用户数监控脚本程序。在没有nagios监控的情况下，只要服务器能上互联网，就可通过发邮件的方式来提醒管理员系统资源的使用情况。

一、编写linux系统告警邮件脚本

# vim /scripts/sys-warning.sh

#!/bin/bash

#监控系统负载与CPU、内存、硬盘、登录用户数，超出警戒值则发邮件告警。

#提取本服务器的

IP=`# 1、监控系统负载的变化情况，超出时发邮件告警：

#抓取cpu的总核数

cpu_num=`grep -c 'model name' /proc/cpuinfo`

#抓取当前系统15分钟的平均负载值

load_15=`#计算当前系统单个核心15分钟的平均负载值，结果小于1.0时前面个位数补0。

average_load=`#取上面平均负载值的个位整数

average_int=`echo $average_load | cut -f 1 -d "."`

#设置系统单个核心15分钟的平均负载的告警值为0.70(即使用超过70%的时候告警)。

load_warn=0.70

#当单个核心15分钟的平均负载值大于等于1.0(即个位整数大于0) ，直接发邮件告警；如果小于1.0则进行二次比较

if (($average_int > 0)); then

echo "$IP服务器15分钟的系统平均负载为$average_load，超过警戒值1.0，请立即处理！！！" | mutt -s "$IP 服务器系统负载严重告警！！！" #当前系统15分钟平均负载值与告警值进行比较(当大于告警值0.70时会返回1，小于时会返回0 )

load_now=`#如果系统单个核心15分钟的平均负载值大于告警值0.70(返回值为1)，则发邮件给管理员

if (($load_now == 1)); then

echo "$IP服务器15分钟的系统平均负载达到 $average_load，超过警戒值0.70，请及时处理。" | mutt -s "$IP 服务器系统负载告警" test@126.com

# 2、监控系统cpu的情况，当使用超过80%的时候发告警邮件：

#取当前空闲cpu百份比值(只取整数部分)

cpu_idle=`#设置空闲cpu的告警值为20%，如果当前cpu使用超过80%(即剩余小于20%)，立即发邮件告警

if (($cpu_idle < 20)); then

echo "$IP服务器cpu剩余$cpu_idle%，使用率已经超过80%，请及时处理。" | mutt -s "$IP 服务器CPU告警" test@126.com

# 3、监控系统交换分区swap的情况，当使用超过80%的时候发告警邮件：

#系统分配的交换分区总量

swap_total=`#当前剩余的交换分区free大小

swap_free=`free -m | grep Swap | awk '{print $4}'`

#当前已使用的交换分区used大小

swap_used=`free -m | grep Swap | awk '{print $3}'`

if (($swap_used != 0)); then

#如果交换分区已被使用，则计算当前剩余交换分区free所占总量的百分比，用小数来表示，要在小数点前面补一个整数位0

swap_per=0`echo "scale=2;$swap_free/$swap_total" | bc`

#设置交换分区的告警值为20%(即使用超过80%的时候告警)。

swap_warn=0.20

#当前剩余交换分区百分比与告警值进行比较(当大于告警值(即剩余20%以上)时会返回1，小于(即剩余不足20%)时会返回0 )

swap_now=`expr $swap_per \> $swap_warn`

#如果当前交换分区使用超过80%(即剩余小于20%，上面的返回值等于0)，立即发邮件告警

if (($swap_now == 0)); then

echo "$IP服务器swap交换分区只剩下 $swap_free M 未使用，剩余不足20%，使用率已经超过80%，请及时处理。" | mutt -s "$IP 服务器内存告警" test@126.com

# 4、监控系统硬盘根分区使用的情况，当使用超过80%的时候发告警邮件：

#取当前根分区(/dev/sda3)已用的百份比值(只取整数部分)

disk_sda3=`#设置空闲硬盘容量的告警值为80%，如果当前硬盘使用超过80%，立即发邮件告警

if (($disk_sda3 > 80)); then

echo "$IP 服务器 /根分区使用率已经超过80%，请及时处理。" | mutt -s "$IP 服务器硬盘告警" test@126.com

#5、监控系统用户登录的情况，当用户数超过3个的时候发告警邮件：

#取当前用户登录数(只取数值部分)

#设置登录用户数的告警值为3个，如果当前用户数超过3个，立即发邮件告警

if (($users >= 3)); then

echo "$IP 服务器用户数已经达到$users个，请及时处理。" | mutt -s "$IP 服务器用户数告警" test@126.com

二、加入任务计划：每十分钟检测一次，有告警则立即发邮件(十分钟发一次)。

三、要实现服务器能够发邮件，须开启

2、创建msmtp配置文件和日志文件(

# vim ~/.msmtprc

account default

host 126.com

from test@126.com

auth

# chmod 600 ~/.msmtprc

3、mutt安装配置：(一般linux下有默认安装mutt)

4、邮件发送测试(-s邮件标题) # echo "邮件内容123456" | mutt -s "邮件标题测试邮件" test@126.com

脚本说明： # 服务器CPU/MEM/DISK监控脚本(server_moniter.sh) #------------------------------------------------------------------ # 对服务器的CPU/MEM/DISK设定阈值，动态监控利用率，超过阈值发送邮件 # 或者短信告警 # # 本脚本通过调用watch_mem函数实现内存利用率监控，这里的内存利用率计算是进程实 # 际使用的内存，也就是used-buffer/cache，超过阈值发送息。 # # 通过调用watch_hd函数实现磁盘利用率监控，这里的磁盘利用率，我采用 # 一个一个磁盘或分区检索，这种方式对于磁盘或分区较多时，可能不太方 # 便，可以采用循环判断。 # # 通过调用wath_cpu函数实现CPU利用率监控，这里是通过在一分钟内2次采 # 集/proc/stat中的CPU数据，再对每1次采集点的数据中的使用CPU时间与空闲CPU时 # 间累加求和，最后将2次采集点运算结果求差，获得CPU在一分钟类# 使用时间利用率， # 这种计算方式比较准确，如果超过阈值发送消息。 # # 在每一个函数中设置一个判断返回值，如果超过阈值，条件为真则返回1，如果返回值 # 为1则将告警消息附加到report中，最后如果report这个文件 # 存在，发送邮件通知管理员，将report做为邮件的正文。 # # 可以将这个脚本添加到定时任务，每隔10分种执行一次检查。 #------------------------------------------------------------------

葵烟

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Linux编写脚本监控系统负载,shell脚本: linux系统的负载与CPU、内存、硬盘、用户数监控...

利用这几天在学习研究shell脚本，写的一些系统负载、CPU、内存、硬盘、用户数监控脚本程序。在没有nagios监控的情况下，只要服务器能上互联网，就可通过发邮件的方式来提醒管理员系统资源的使用情况。一、编写linux系统告警邮件脚本# vim /scripts/sys-warning.sh#!/bin/bash#监控系统负载与CPU、内存、硬盘、登录用户数，超出警戒值则发邮件告警。#提取本服务器...
复制链接

扫一扫