- 博客(6)
- 收藏
- 关注
原创 kubectl top与docker stats内存不一致问题
文章目录前言一、cgroupcgroup目录下常用文件的含义例如memory目录下常用文件的含义展开描述memory.stat文件中的信息kubectl top监控原理数据链路监控体系kubectl top与docker stats内存不一致问题三个内存计算公式:kubectl top 与 docker status的计算方式:kubelet oom kill 的依据:Java应用的内存读取机制和oom kill依据(8u以下版本)假设:是否有解决办法?总结一下前言随着云原生技术的逐渐深入和成熟,监控对
2021-08-06 16:15:42 4012 1
原创 在没有快照的情况下恢复etcd集群
在没有快照的情况下恢复etcd集群文章目录在没有快照的情况下恢复etcd集群前言当前集群环境操作步骤1、通过删除所有其他 etcd 节点,在集群中只保留一个 etcd 节点。2、在剩下的 etcd 节点上也就是node01上,运行以下命令:3、停止上一步在node01启动的 etcd 容器,将其重命名为 etcd-old。4、修改步骤 2 中保存的命令5、 在node01上运行修改后的命令,则单个etcd节点重建成功。6、在单个节点启动并运行之后,需要向集群添加另外两个 etcd 节点。7、执行以下命令查
2021-05-19 11:43:45 439
原创 踩坑内核参数tcp_tw_recycle
文章目录踩坑内核参数tcp_tw_recycle一、问题背景二、优化分析1.参数解释2.原理分析及优化建议(1)什么是TCP TIME-WAIT状态:(2)TIME-WAIT存在的作用及原因:(3)开启tcp_tw_recycle后为什么会造成网络问题:现象一:延迟的出现现象二:没有ACK回包(4) tcp_tw_recycle参数的移除三、操作步骤踩坑内核参数tcp_tw_recycle一、问题背景近期我们发现客户生产环境出现了偶发性的502报错,表现为点击浏览器或APP页面时会出现502错误,复现
2021-01-06 11:22:19 9495 1
原创 由于无法分配ip而导致的FailedCreatePodSandBox
由于无法分配ip而导致的FailedCreatePodSandBox一、问题现象二、排查思路三、问题原因四、解决办法一、问题现象描述:当pod调度到某主机上时,pod无法正常启动并显示如下图事件。二、排查思路查看网络插件日志。去主机上看/var/lib/cni/networks/default-cni-network这个目录 发现ip已经占满,如下图现象。三、问题原因这是kubernetes的一个老问题了,与容器无法启动/失败时不清理容器ip有关该问题的根本原因是由于pod生命周
2020-12-31 11:39:01 2160 2
原创 分析k8s service生成的iptables规则数量
分析k8s service生成的iptables规则数量前言一、分析过程1.集群内调用service2.cluster ip工作原理3. 从output链开始看实验过程的截图,可参照此流程做链路规则分析pod与service数量1-2pod与service数量2-2总结前言本文通过实际查看规则表确认Pod数量、Service数量、节点数量和iptables规则数量的对应计算关系提示:以下是本篇文章正文内容,以下计算方式可供参考一、分析过程1.集群内调用service集群内POD调用serv
2020-12-30 14:15:44 1097
原创 二进制方式升级containerd版本
当前环境版本信息docker:19.03.9containerd:1.3.9 —> 1.4.31. github下载二进制containerd链接: https://github.com/containerd/containerd/releases/tag/v1.4.32.解压containerdtar -zxvf containerd-1.4.3-linux-amd64.tar.gz 3.检查当前containerd版本docker info containerd -v.
2020-12-29 16:54:23 2381 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人