k8s 排故
文章平均质量分 86
山河已无恙
Red Hat 认证架构师(RHCA)、CNCF 认证 K8s 管理员(CKA)、@ _ @ 兴趣是吃饭,喜欢吃饱了晒太阳。分享技术干货,CSDN、51CTO 博客专家,InfoQ 写作平台、Alibaba Cloud 开发者社区签约作者、Tencent Cloud 开发者内容共创官、Huawei Cloud 云享专家
展开
-
K8s 集群高可用master节点ETCD全部挂掉如何恢复?
博文内容涉及集群 ETCD 全部挂掉,通过备份文件恢复的操作 Demo理解不足小伙伴帮忙指正 😃,生活加油不必太纠结于当下,也不必太忧虑未来,当你经历过一些事情的时候,眼前的风景已经和从前不一样了。——村上春树前提是需要etcd备份文件,如果没有etcd备份,或者其他的备份手段,可能 GG 了这里默认需要使用etcdctl的地方已经安装了该工具。原创 2024-06-09 16:30:52 · 925 阅读 · 0 评论 -
K8s 集群高可用master节点ETCD挂掉如何恢复?
很常见的集群运维场景,整理分享博文内容为 K8s 集群高可用master节点故障如何恢复的过程理解不足小伙伴帮忙指正不必太纠结于当下,也不必太忧虑未来,当你经历过一些事情的时候,眼前的风景已经和从前不一样了。——村上春树。原创 2024-03-17 01:53:55 · 1676 阅读 · 0 评论 -
如何在k8s节点故障、维护期间 解决Pod 频繁调度工作负载可用性的问题?
分享一些的笔记博文内容涉及:为什么需要PDB,什么是PDB?PDB可以做什么?配置创建PDBDemoPDB原理简单说明理解不足小伙伴帮忙指正不念过去,不畏将来,不负余生。原创 2023-05-09 20:42:00 · 991 阅读 · 0 评论 -
记一次虚机强制断电磁盘损坏导致 K8s 集群 部分节点未就绪(NotReady) 问题解决
自己的实验环境遇到,分享解决过程理解不足小伙伴帮忙指正我所渴求的,無非是將心中脫穎語出的本性付諸生活,為何竟如此艱難呢 ------赫尔曼·黑塞《德米安》原创 2023-01-19 10:50:21 · 1694 阅读 · 2 评论 -
记一次虚机强制断电 K8s 集群 etcd pod 挂掉快照丢失(没有备份)问题处理
不小心拔错电源了,虚机强制关机,开机后集群死掉了记录下解决方案断电导致etcd 快照数据丢失,没有备份.基本上是没办法处理可以找专业的 DBA来处理数据看有没有可能恢复这篇博文的解决办法是删除了 etcd 数据目录中的部分文件。集群可以启动,但是 部署的环境数据都丢失了,包括CNI, 集群自带的 DNS 组件也丢了。理解不足小伙伴帮忙指正不管是生产还是测试, k8s集群 ETCD 一定要备份,ETCD 一定要备份,ETCD 一定要备份 ,重要的话说三遍。原创 2023-01-23 23:09:43 · 3516 阅读 · 0 评论 -
K8s CrashLoopBackOff 如何排障?
整理排故相关笔记分享给小伙伴。博文内容涉及:什么是 CrashLoopBackOff?如何对 CrashLoopBackOff 排故?理解不足小伙伴帮忙指正中秋明月,豪门有,贫家也有。极慰人心。——烽火戏诸侯《剑来》是在 k8s 中较常见的一种Pod异常状态,最直接的表述,集群中的 Pod 在不断的重启挂掉,一直循环,往往 Pod 运行几秒钟 因为程序异常会直接死掉,没有常驻进程,但是 容器运行时 会根据 Pod 的重启策略(默认为:always)一直的重启它,所以会pod的重启策略。原创 2023-03-26 14:09:53 · 2381 阅读 · 2 评论 -
Kubernetes 触发 OOMKilled(内存杀手)如何排除故障
简单整一下 k8s 中 Pod 故障OOMKilled的原因以及诊断博文内容涉及:k8sOOMKilled分类: 宿主节点行为 / K8s Cgroups 行为什么是OOMKilledK8s 错误,OOMKiller 机制如何工作?OOMKilledK8s 错误和解决的常见原因理解不足小伙伴帮忙指正对每个人而言,真正的职责只有一个:找到自我。然后在心中坚守其一生,全心全意,永不停息。原创 2023-07-19 01:20:27 · 1196 阅读 · 0 评论 -
关于Kubernetes集群中常见问题的排查方法的一些笔记
一切时代的艺术都在努力为我们内心那神圣的无声的欲望提供语言。 ——赫尔曼·黑塞《彼得·卡门青》原创 2022-02-01 18:46:02 · 2407 阅读 · 2 评论 -
K8s:Kubernetes 故障排除方法论
博文内容为节译整理文中提到的工具大部分是商业软件,不是开源的,作为了解理解不足小伙伴帮忙指正对每个人而言,真正的职责只有一个:找到自我。然后在心中坚守其一生,全心全意,永不停息。所有其它的路都是不完整的,是人的逃避方式,是对大众理想的懦弱回归,是随波逐流,是对内心的恐惧 ——赫尔曼·黑塞《德米安》原创 2023-07-29 19:59:34 · 913 阅读 · 0 评论 -
K8s集群故障(The connection to the server... was refused - did you specify the right host or port)解决
过年回家整理集群相关的笔记,发现集群不能用了.简单记录解决办法,其实就是证书过期了,但是提示和之前的不一样。理解不足小伙伴帮忙指正不必太纠结于当下,也不必太忧虑未来,当你经历过一些事情的时候,眼前的风景已经和从前不一样了。——村上春树。原创 2024-02-09 17:52:39 · 1278 阅读 · 0 评论