1: 一个个pod剔除,直到机器load为0(空机器)
关注“上下文切换” 指标
记录移除了哪些pod 产生了哪些变化
验证free少的机器,load高?
结论:
a:进程数越多,即使CPU空闲率比较高,但是load还是有可能比较高,因为进程切换占用CPU时间
b:io wait 也会造成load虚高,需要排查 iostat -xz 1 看%util是否过高
分析结果:
a:机器没有流量,pod比较多(20+searcher pod),负载在2左右,比较高
机器没有流量,无pod,负载在0.6左右,比较低
期待的结果是,机器没有流量,负载都应该比较低!!!!
b: 当pod被依次迁移走,发生变化的变量有:
进程数
上下文切换
内存
c:
删除adapter的时候,内存释放了20G,但是负载没有发送变化,说明负载和内存并没有直接的关联
通过不断减少任务数目,负载未发送变化,任务数目也和负载并没有明显的关联
searcher的即使没有流量,只要pod越多,负载就会越高,merger也是!
最终结论:
进程上下文切换越多,负载越高,目前看进程上下文切换与pod的数目是