使用python和shell监控linux服务器

最新推荐文章于 2024-10-12 17:09:32 发布

Allen-X

最新推荐文章于 2024-10-12 17:09:32 发布

阅读量2.6k

点赞数

分类专栏： linux 文章标签：命令 python shell 服务器

本文链接：https://blog.csdn.net/u010827436/article/details/45368741

版权

本文介绍了如何使用shell脚本监控Linux服务器负载，通过`uptime`获取负载信息并进行阈值判断。此外，利用Python编写监控脚本`monitor.py`，结合crontab定时任务，当达到预警条件时发送邮件报警，并记录JVM参数。

摘要由CSDN通过智能技术生成

github欢迎各位大神一起探讨学习~

1、 shell监控负载

监控原理：使用uptime来获取负载的信息，然后通过字符串截取的方式来获取load值来获取单个核心的负载，在将负载与阈值比较确定是否报警。

loard_monitor.sh脚本：

#!/bin/bash
#使用uptime命令监控linux系统负载变化

#提取本服务器的IP地址信息
IP=`ifconfig eth0 | grep "inet addr" | cut -f 2 -d ":" | cut -f 1 -d " "`

#抓取cpu的总核数
cpu_num=`grep -c 'model name' /proc/cpuinfo`

#抓取当前系统15分钟的平均负载值
load_15=`uptime | awk '{print $NF}'`

#计算当前系统单个核心15分钟的平均负载值，结果小于1.0时前面个位数补0。
average_load=`echo "scale=2;a=$load_15/$cpu_num;if(length(a)==scale(a)) print 0;print a" | bc`

#取上面平均负载值的个位整数
average_int=`echo $average_load | cut -f 1 -d "."`


#当单个核心15分钟的平均负载值大于等于1.0（即个位整数大于0） ，直接发邮件告警
if (($average_int > 0)); then
      python  /opt/monitor/monitor.py "服务器15分钟的系统单个核心平均负载为$average_load，超过警戒值1.0，请立即处理！！！"

fi