zabbix 测试shell_zabbix中监控某个进程的shell脚本

本文介绍如何使用Zabbix通过shell脚本来监控dotnet进程。脚本通过`ps`命令匹配进程,减去awk自身进程数,判断是否正常运行。在Zabbix中配置UserParameter,使agent能够执行脚本并获取返回值。当进程数量低于阈值时,触发报警。
摘要由CSDN通过智能技术生成

#!/bin/shret_ok=1ret_warn=2ret_critical=3ret_unknown=4info_count=`ps -aux | awk 'BEGIN {cnt=0} /[^-c] dotnet GameServer.dll/{++cnt} END {print cnt}'`

process_count=$((${info_count}-1))if [[ ${process_count} < 6 ]]; then

echo${ret_critical}else

echo${ret_ok}fi

这里还有一个带参数的以供参考

#!/bin/bash

#port on each server

port=$1#result code

ret_ok=1ret_warn=2ret_critical=3ret_unknown=4#get heartbeat message

#url:http://127.0.0.1:9002/heartbeat

curl_result=`curl -m 3 -s http://127.0.0.1:$port/heartbeat`

if [[ ${curl_result} == *"alive"* ]]; then

echo${ret_ok}else

echo ${ret_critical}

ps -aux查出来进程,用awk正则匹配,然后输出匹配行数,减去awk本身,其中进程名那里可以使用变量,这里图省事就写死了,反正以后可以再改

然后再在zabbix中添加

[root@zabbiclient1 zabbix_agentd.conf.d]# pwd

/usr/local/zabbix/etc/zabbix_agentd.conf.d

[root@zabbiclient1 zabbix_agentd.conf.d]# ll check_process.conf-rw-r--r-- 1 root root 533 Dec 26 2013check_process.conf

[root@zabbiclient1 zabbix_agentd.conf.d]#catcheck_process.conf

UserParameter=check.dotnet,/etc/zabbix/scripts/check_dotnet_running ##注意check.crontab必须和下面创建item时的key相对应

如果是带参数的,就在逗号后边的command后边加上[]中间括着参数,比如

UserParameter=check.dotnet[*],/etc/zabbix/scripts/check_dotnet_running $1

在zabbix client机器上include 相关文件,

[root@zabbiclient1 etc]# pwd

/usr/local/zabbix/etc

[root@zabbiclient1 etc]#lszabbix_agent.conf zabbix_agent.conf.d zabbix_agentd.conf zabbix_agentd.conf.d

[root@zabbiclient1 etc]#cat zabbix_agentd.conf | grep -v "#" | grep -v "^$"PidFile=/tmp/zabbix_agentd.pid

LogFile=/tmp/zabbix_agentd.log

DebugLevel=4Server=192.168.10.134ServerActive=192.168.10.134Hostname=zabbixclient1

Include=/usr/local/zabbix/etc/zabbix_agentd.conf.d/check_process.conf ###Include该文件!

3: 下面关键的重点是通过zabbix_get 获取check.dotnetkey的值,这个值在创建trigger时时需要,否则

trigger表达式填写不正确,就无法触发trigger

当我将crond进程在134机器上stop掉的时候,在133机器上获取值

[root@zabbiclient2 ~]# /usr/local/zabbix/bin/zabbix_get -s  192.168.10.134   -k check.dotnet

3

如果是有参数的,就是这样测试/usr/local/zabbix/bin/zabbix_get -s  192.168.10.134   -k check.dotnet[5],并在创建模板的时候在key中加入中括号加入参数

下面就创建一个模板,我创建的模板名为apptemplate,在模板里面创建一个item,crond is running,update interval 我设置为30s,见

然后创建一个trigger,trigger名为:dotnet does not work, 表达式值为{apptemplate:check.crontab.last(0)}=3

Severity 选择disaster,点save按钮即可创建。见附件

4:然后就可以在134机器上手动执行service dotnet stop,看看是否触发trigger,当然生产系统我就不完活了,你们自己慢慢玩吧

或另外一种方式:

Zabbix监控一个服务是否存在

有两种方法:

1:数进程数

接着创建trigger:

还有一种情况,例如:iptables,尽管它启动了,但不能通过ps –ef  | grep iptables 来数进程数,这个时候就需要另外一种访问来处理了,见附件:

接着创建trigger,如下:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值