Firewalld reload引起的ETCD超时故障排查

最新推荐文章于 2024-03-05 14:14:05 发布

wvwvmiao

最新推荐文章于 2024-03-05 14:14:05 发布

阅读量2k

点赞数

分类专栏： K8S 文章标签： etcd 数据库 kubernetes linux

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wvwvmiao/article/details/125622496

版权

K8S 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

测试人员在系统使用过程中发现页面会时不时卡顿一会儿，查看日志后发现是由于etcd访问超时引起的：

# 访问超时

{"level":"warn","ts":"2022-03-30T17:35:37.733+0800","caller":"clientv3/retry_interceptor.go:62","msg":"retrying of unary invoker failed","target":"endpoint://client-81685990-3b94-4e45-a30b-3cd6b82579a5/nsp-etcd:22379","attempt":1,"error":"rpc error: code = Unknown desc = context deadline exceeded"}

# etcd切换leader

{"level":"warn","ts":"2022-03-30T17:35:34.001+0800","caller":"clientv3/retry_interceptor.go:62","msg":"retrying of unary invoker failed","target":"endpoint://client-81685990-3b94-4e45-a30b-3cd6b82579a5/nsp-etcd:22379","attempt":0,"error":"rpc error: code = Unavailable desc = etcdserver: leader changed"}

超时和重新选举的截图：

学习了一下etcd的工作原理和raft协议，发现我们设置的参数对网络质量要求较高，—election-timeout值为100，100m收不到心跳就会重新选举，所以就需要检查是什么原因导致的超时。

写了个脚本对几个方向的网络目标进行长ping，ping的间隔设置为1秒10次，发现确实会偶尔出现丢包现象，因为丢包时间很短（少于1秒），因此使用常规的ping无法发现。

排查了各种会导致网络丢包的组件，最终定位在firewalld，每次修改规则后我们都使用了reload来重新加载规则，这种方式会导致系统iptables规则重置，出现短暂的丢包。

修改了firewalld的配置方式，问题得到了解决。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Firewalld reload引起的ETCD超时故障排查

Firewalld reload引起的ETCD超时故障排查
复制链接

扫一扫

专栏目录

wvwvmiao CSDN认证博客专家 CSDN认证企业博客

码龄16年

3: 原创

68万+: 周排名

71万+: 总排名

3571: 访问

: 等级

67: 积分

0: 粉丝

2: 获赞

4: 评论

3: 收藏

私信

关注

热门文章

分类专栏

最新评论

使用阿里云源安装指定版本的K8S
bo_hai: https://developer.aliyun.com/mirror/kubernetes
使用阿里云源安装指定版本的K8S
bo_hai: [code=plain] cat <<EOF > /etc/yum.repos.d/kubernetes.repo [kubernetes] name=Kubernetes baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64/ enabled=1 gpgcheck=1 repo_gpgcheck=1 gpgkey=https://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpg https://mirrors.aliyun.com/kubernetes/yum/doc/rpm-package-key.gpg EOF setenforce 0 yum install -y kubelet kubeadm kubectl systemctl enable kubelet && systemctl start kubelet [/code]
使用阿里云源安装指定版本的K8S
CSDN-Ada助手: 不知道云原生入门技能树是否可以帮到你：https://edu.csdn.net/skill/cloud_native?utm_source=AI_act_cloud_native

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。