一、故障产生
在不关闭kubernets相关服务的情况下,对kubernets的master节点进行重启。(模拟服务器的异常掉电)
二、故障状况
启动后无法远程到kubernets的dashbaord,后进行如下命令报错。
kubectl get pods
The connection to the server xx.xxx.x.xxx:6443 was refused - did you specify the right host or port?
故障处理:
1.检查环境变量情况(正常)
# env | grep -i kub
2.检查docker服务(正常)
systemctl status docker.service
3.检查kubelet服务(表面正常)
systemctl status kubelet.service
4.查看端口是是否被监听(没有监听)
netstat -pnlt |grep 6443
5.检查防火墙状态(正常)
systemctl status firewalld.service
6.查看日志
sudo journalctl -xeu kubelet
这里分析,应该是镜像的问题。
6.1 重新导入一下API镜像即可
docker load -i xxxx.tar
6.2 重启docker和kubelet服务
systemctl restart docker.service
systemctl restart kubelet.service
6.3 检查服务(STATUS正常即可)
kubectl get nodes