1.场景:
容器一直处在 ContainerCreating状态
$ kubectl get pod -n liantiao | grep pushserver
pushserver-69cc66c679-tx2pg 1/1 Running 0 98d
pushserver-76675b6d94-kqh25 0/1 ContainerCreating 0 56m
2.查看log describe 并没有发现 有效信息
$ kubectl describe pod pushserver-76675b6d94-kqh25 -n liantiao
Normal Scheduled 57m default-scheduler Successfully assigned liantiao/pushserver-76675b6d94-kqh25 to cn-beijing.10.252.0.120
$ kubectl logs pushserver-76675b6d94-nq4bg -n liantiao
Error from server (BadRequest): container "pushserver" in pod "pushserver-76675b6d94-nq4bg" is waiting to start: ContainerCreating
3.显示无法创建,使用 -o wide
去目标主机上查看
发现 登陆特别慢,我大概猜测应该是 节点的问题,无法调度到这个容器上去,
我就删除了 这个pod(重启),希望他能调度到别的节点上;但是 还是调度到这个节点上了(一直ContainerCreating)
4.k8s组件里面,kubelet是负责启动pod的
查看kubelet 的日志
登陆 目标主机
# journalctl -l -u kubelet #kubelet是被system管理的
Orphaned pod "0009ae9e-d542-11ea-852a-00163e125f5d" found, but volume paths are still present on disk : There were a to
Orphaned pod "0009ae9e-d542-11ea-852a-00163e125f5d" found, but volume paths are still present on disk
有大量报错
参考:https://cloud.tencent.com/developer/article/1385911
一直在刷以下的报错,从错误信息可以推测到,这台计算节点存在一个孤儿Pod,并且该Pod挂载了数据卷(volume),阻碍了Kubelet对孤儿Pod正常的回收清理。
节点有问题 https://cloud.tencent.com/developer/article/1385911,按照这里的方法删掉了 /var/lib/kubelet/pods/ 下的目录,并重启了systemctl进程
systemctl daemon-reexec
:不重新启动的情况下重新启动systemd
执行这个命令 是因为 我的kubelet是被 systemd管理的