使用rancher部署集群,重启集群之后(master与node 在同一台主机上面)
Error from server (InternalError): an error on the server ("error trying to reach service: dial tcp 127.0.0.1:6443: connect: connection refused") has prevented the request from succeeding
然后登录rancher管控界面上面看到对应的集群状态Unavailable。
在主机上执行ps -ef|grep kube-api,进程不在了。
继续执行
docker ps -a -f=name='kube-apiserver|kube-controller-manager|kube-scheduler'
kube-apiserver一直在重启。
继续执行docker logs kube-apiserver
找到有这个错误:
E1212 22:15:10.814363 1 metrics.go:110] Error in audit plugin 'webhook' affecting 164 audit events: Post "http://127.0.0.1:8080/": dial tcp 127.0.0.1:8080: connect: connection refused
由于webhook的接收方没有起来导致的。运行起来再观察对应的进程和容器