监控策略
1、Kafka总体监控
leader 选举频率:kafka.controller:type=ControllerStats,name=LeaderElectionRateAndTimeMs
2、Kafka Broker监控
kafka集群中Broker列表,broker运行状况,包括node下线,活跃数量
Broker是否提供服务
失败的生产消息请求数量:阈值?
失败的数据获取请求数量:阈值?
消费比率(生产字节数/消费字节数):阈值?
kafka.server:type=BrokerTopicMetrics,name=BytesInPerSec
kafka.server:type=BrokerTopicMetrics,name=BytesOutPerSec
ISR 收缩频率:阈值?
kafka.server:type=ReplicaManager,name=IsrShrinksPerSec
kafka.server:type=ReplicaManager,name=IsrExpandsPerSec
未复制的分区数:阈值>1
kafka.server:type=ReplicaManager,name=UnderReplicatedPartitions
producer队列排队情况:阈值?
kafka.server:type=DelayedOperationPurgatory,delayedOper