![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
k8s 问题集锦
SRE运维进阶之路
这个作者很懒,什么都没留下…
展开
-
卸载 rancher 导致 node 被清空
操作类似的 k8s web 管理平台,尤其删删除卸载时,务必小心,没有把握不要操作,网上的脚步慎用,最好用官方提供的卸载方式,恰巧当时 rancher 官方的卸载方式好久没有维护了,说多了都是泪。由于当时没有排查出来问题,当时批量重启了服务器,自动拉起 kubelet 重新注册 node,故障恢复。node 被清空前,查看 history,发现有卸载 rancher 的操作,很可疑,调查发现,rancher 自定义crd。为空),导致集群瘫痪,但实际上节点对应的宿主机都还在。集群的节点突然全都不见了 (原创 2023-02-05 00:32:43 · 316 阅读 · 0 评论 -
lvs 健康检查 k8s apiserver
apiserver前面如果有lvs做高可用,lvs对apiserver做健康检测要注意不能使用tcp check,否则会触发报错。原创 2023-02-05 00:31:48 · 177 阅读 · 0 评论