16、排查集群中故障节点
题目:
设置配置环境:
[candidate@node-1] $ kubectl config use-context wk8s
Task
名为 node02 的 Kubernetes worker node 处于 NotReady 状态。
调查发生这种情况的原因,并采取相应的措施将 node 恢复为 Ready 状态,确保所做的任何更改永久生效。
可以使用以下命令,通过 ssh 连接到 node02 节点:
ssh node02
可以使用以下命令,在该节点上获取更高权限:
sudo -i
参考链接:
没必要参考网址,记住先 restart 再 enable 就行。
https://kubernetes.io/zh-cn/docs/setup/production-environment/tools/kubeadm/kubelet-integration/
解答:
更换 context
$ kubectl config use-context wk8s
ssh 到 node02 查看 kubelet
$ ssh node02
$ sudo -i # root
# 查看 kubelet 状态
$ systemctl status kubelet
$ systemctl restart kubelet && systemctl enable kubelet
检查
$ systemctl status kubelet
# 考试时记得从 node2 退回到 node1
$ exit
$ exit