监控内容:
- 未处理消息数量
- 处理的消息数量
- 进程
监控流程:
目录:
/etc/zabbix/zabbix_agentd.d/rabbitmq.conf
/etc/zabbix/zabbix_agentd.d/script/rabbitmq_check.sh
/etc/zabbix/zabbix_agentd.d/script/rabbitmqmonitor.py #单独执行可以看到所有队列名称及接收到的消息和处理的消息
文件内容:
rabbitmqmonitor.py
#!/usr/bin/env python
#-*- coding: utf-8 -*-
try:
import json
except:
import simplejson as json
import commands
(status, output) = commands.getstatusoutput("""curl -s -u admin:rabbitmq@codeus http://127.0.0.1:15672/api/queues""") #获取所有队列信息
outputjson = json.loads(output) #格式化获取到的信息
for one in outputjson:
print(one['name']) #输出队列名称
print(one['messages_ready']) #输出未处理消息数量
if(one.has_key('message_stats')): #判断队列中是否有message_stats字段
if(one.has_key('deliver_get')): #判断message_stats下有没有deliver_get字段
print(one['message_stats']['deliver_get']) #有则输出处理消息数量
continue
print(0) #没有message_stats字段输出0
rabbitmq_check.sh
queuename=$1 #接受传值队列名称
queuetype=$2 #接受传值队,想知道队列中未处理消息数量还是处理消息量
result=$(python /etc/zabbix/zabbix_agentd.d/script/rabbitmqmonitor.py)
case $2 in
"unread") echo "$result" |grep "^$queuename$" -A 2 |awk 'NR==2';; #未处理消息量
"read") echo "$result" |grep "^$queuename$" -A 2 |awk 'NR==3';; #处理消息量
*) echo "unsupport key";; #其他传值
esac
rabbitmq.conf
UserParameter=rabbitmq.status[*],sh /etc/zabbix/zabbix_agentd.d/script/rabbitmq_check.sh $1 $2
测试:
zabbix-agent重启后在server端
zabbix_get -s 172.17.223.1 -p 10050 -k rabbitmq.status[user.work.ems,unread]
web配置:
未处理消息数量监控及告警配置
每秒处理消息量监控
此处为配置告警,后续可配置告警阈值,例如现有节点消费能力为每秒并发1000,则可根据配置阈值告警及时增加消费节点
进程监控:
利用ps找到进程名称
键值来源于键值选择中,将进程名添加即可,也可选择使用端口进行监控,自己选择