使用k8s搭建服务集群,发现有服务正常启动之后,过一会就被驱逐了
可以看到,容器被驱逐之后无限重启,一直都是失败,直到最后切换了节点才成功。被驱逐的节点,都是一台服务器172.16.0.32,我们看一下详情
上图是一个被驱逐节点的事件,红框标出来的意思是节点资源不足。问题很明确了,我们去看一下这台服务器的监控信息
发现这台服务器的磁盘使用率很高,k8s有种机制,当服务器磁盘使用超过85%之后就不允许节点再次创建了,所以节点创建之后就被驱逐了,目前这个云盘是40G,我们直接扩容一下。
注意,先把这台ecs状态改成不可调度,然后创建好快照,然后按照步骤扩容,扩容之后,我们再看一下监控
发现扩容成功了
回到k8s集群,将被驱逐的节点删除掉,此时问题应该就解决掉了,后续我们继续观察