Rabbitmq - 监控

系统层面

- CPU  
    - user, system, iowait & idle percentages
- MEM
    - used, buffered, cached & free percentages
- Virtual Memory 
    - dirty page flushes, writeback volume
- Disk I/O
    - operations & amount of data transferred per unit time, time to service operations
- Free disk space
    - node data directory
- File descriptors
    - beam.smp vs. max system limit
- TCP connections
    - ESTABLISHED, CLOSE_WAIT, TIME_WAIT
- Network throughput
    - bytes received, bytes sent, maximum network throughput
- Network latency
    - between all RabbitMQ nodes in a cluster as well as to/from clients
    

Rabbitmq层面

集群监控

可以从任一节点获取集群监控数据

API:GET /api/overview

指标JSON field name
集群名称cluster_name
集群范围的消息速率message_stats
连接总数object_totals.connections
channel总数object_totals.channels
队列总数object_totals.queues
消费者总数object_totals.consumers
消息总数(ready+unacked)queue_totals.messages
准备交付的消息数量queue_totals.messages_ready
未确认的消息数量queue_totals.messages_unacknowledged
最近发布的消息数量message_stats.publish
消息发布的速率message_stats.publish_details.rate
最近发送给消费者的消息数量message_stats.deliver_get
消息交付速率message_stats.deliver_get.rate

节点监控

获取节点信息的API:
GET /api/nodes/{node} 返回单个节点的状态
GET /api/nodes 返回所有集群成员的统计信息

指标JSON field name
使用的内存总量memory usedmem_used
内存使用阈值mem_limit
当内存使用超过阈值时将触发报警memory alarmmem_alarm
剩余磁盘空间阈值disk_free_limit
当空闲磁盘空间低于配置的限制时,将触发报警disk_free_alarm
可用文件描述符总数fd_total
当前使用的文件描述符fd_used
尝试打开的文件描述符数量io_file_handle_open_attempt_count
socket可用sockets_total
已经使用的socket数量sockets_used
==Message store disk reads==message_stats.disk_reads
==Message store disk writes==message_stats.disk_writes
==Inter-node communication links==cluster_links
GC runsgc_num
gc回收的字节gc_bytes_reclaimed
erlang进程限制proc_total
已经使用erlang进程proc_used
正在运行的队列run_queue

单个队列监控

API地址: GET /api/queues/{vhost}/{qname}

指标JSON field name
内存memory
消息总数(ready+unacknowledged)messages
准备交付的消息数量messages_ready
未确认的消息数量messages_unacknowledged
最近发布的消息数量message_stats.publish
消息发布速度message_stats.publish_details.rate
最近交付的消息数量message_stats.deliver_get
消息交付速度message_stats.deliver_get.rate
其他消息状态 this documentmessage_stats

健康检查

集群中是否有资源报警  rabbitmq-diagnostics -q alarms  

查看 rabbitmq是否正常运行(没有stop_app或pause)rabbitmq-diagnostics check_running  

检查当前节点是否有报警,如果有,将以非零状态退出 rabbitmq-diagnostics check_local_alarms     

转载于:https://www.cnblogs.com/mldblue/articles/10974358.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值