简介
最近遇到k8s master被误操作删除的问题,最后经过各方努力把集群恢复了,恢复的过程中遇到calico node无法工作的问题 请求10.96.0.1失败,首先怀疑是kube-proxy不能正常工作,查看日志发现几条报错 kube-proxy Failed to retrieve node info: Unauthorized
解决方案
看了下前人的解决方案,怀疑是集群重置后ca证书等发生了变化,需要重新删除kube-proxy使用到的secret,这个secret删除后系统会新建一个secret,新建后重启所有的kube-proxy,问题得到解决,calico node也正常的启动
kubectl get secret -n kube-system |grep kube-proxy
kubectl delete secret -n kube-system kube-proxy-token-xxx
kubectl get secret -n kube-system |grep kube-proxy
kube-proxy-token-f2n8l kubernetes.io/service-account-token 3 95d
kubectl delete secret -n kube-system kube-proxy-token-f2n8l