Kafka系列之:实现对Kafka集群的监控
一、Kafka监控数据
- Kafka监控指标:broker指标、主题的指标,集群层面的指标可以通过各个broker的指标值累加获得
- Kafka通过JMX来获取,在使用JMX之前需要确保Kafka开启了JMX的功能。
- Kafka在启动时需要通过配置JMX_PORT来设置JMX的端口号并以此来开启JMX的功能。
示例如下:
JMX_PORT=9999 nohup bin/kafka-server-start.sh config/server.properties &
- 开启JMX之后会在ZooKeeper的/brokers/ids/<brokerId>节点中有对应的呈现(jmx_port字段对应的值)
- 开启JMX功能之后,最简单的获取监控指标的方式是直接使用Java自带的工具JConsole
二、同步失效分区
-
<

本文介绍了如何实现对Kafka集群的监控,包括Kafka的监控数据、同步失效分区的检查以及关键监控指标。通过JMX获取broker和主题指标,关注UnderReplicatedPartitions以发现失效分区。当该值大于0时,可能表明性能问题。负载不均衡和资源瓶颈是集群问题的主要原因,需要关注CPU、网络、I/O等资源使用情况。此外,网络流入速率、流出速率、请求次数、ISR变化等也是重要的监控指标。
订阅专栏 解锁全文
594

被折叠的 条评论
为什么被折叠?



