问题描述
第一次出现是在操作完A号broker的重启后,13号broker的网络线程idle走低
一直到14号发起了一次重均衡(触发leader选举)之后13号(对应下图灰色实例)的broker网络线程idle恢复,转而1号broker(对应下图黄色实例)的网络线程idle开始走低
分析过程
各个broker间的流量没有差异,和network idle match的是broker进程cpu usage,接着看cpu上线文切换也match
再看网络连接虽然有差异,但是蓝色的broker比黄色的broker连接还要多却idle却不低,所以可以排除客户端连接不均
再看包的个数,差异是match的,问题broker的出入包的个数偏多,推断是包过多导致的网络设备中断从而触发cpu上线文切换偏高