问题描述:
异常排除过程:
- 重启master节点后,执行:
root@k8s-master:~/k8sYamlFile# kubectl get node
输出:The connection to the server 192.168.253.8:6443 was refused - did you specify the right host or port?
- 检查
netstat -ntp
,发现6443服务并未开启,判断kubectl服务异常 - 使用systemctl status kubelet.service 查看日志信息,异常信息如下
k8s.io/kubernetes/pkg/kubelet/kubelet.go:445: Failed to list *v1.Service: Get https://192.168.253.8:6443/api/v1/
k8s.io/client-go/informers/factory.go:133: Failed to list *v1beta1.RuntimeClass: Get https://192.168.253.8:6443/
node “k8s-master” not found
由于有多个服务没开启,故检查docker运行情况
使用docker ps 发现已经启动的容器均处于Running状态;但仍有服务报错,怀疑有服务没启动起来。
使用docker images 查看到本地只有三个镜像:
于是重新添加镜像(注意,所添加镜像一定要与系统版本符合,本镜像是集群但是构建时使用的!)完整镜像如下所示:
镜像补充完后,重启docker、kubelet:
- systemctl restart docker
- systemctl restart kubelet
至此,集群恢复正常!