现象:
机器断电重启节点NotReady,查看apiServer 无法启动
原因:
Unexpected error while attempting to recover from admission failure: preemption: error finding a set of pods to preempt: no set of running pods found to reclaim resources
因为资源不足,导致apiServer无法启动。不过无法理解,机器重启后,内存和cpu资源都充足才对。查看dmesg信息:
发现出现cpu坏了的问题,但是64核CPU也不是都坏了呀,查看k8s源码,发现k8s如果发现cpu坏了,就将cpu置为0,所以资源不足,导致apiserver无法启动,所以机器报修