ETCD: request timed out

最新推荐文章于 2025-03-21 10:11:56 发布

大鹏blog

最新推荐文章于 2025-03-21 10:11:56 发布

阅读量2.2w

点赞数 3

分类专栏： ETCD DEVOPS

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/textdemo123/article/details/96460680

版权

DEVOPS 同时被 2 个专栏收录

18 篇文章

订阅专栏

5 篇文章

订阅专栏

背景：
在部署kubernetes的时候执行 kubeadm init失败，查看日志发现连接etcd超时
在这里插入图片描述
docker化的ETCD集群，查看etcd集群状态

docker exec etcd etcdctl --endpoints http://172.168.200.45:2379 cluster-health

集群处于非健康状态，就能解释为什么etcd ：request timed out
在这里插入图片描述
但是为什么会集群降级呢？
我们在三个节点上均看了一下 leader 和self信息

 curl http://172.168.200.46:2379/v2/stats/leader
 curl http://172.168.200.46:2379/v2/stats/self

发现输出信息完整，有leader ，有followers
在这里插入图片描述

而且节点上没有错误信息，leader上也没有错误信息

在查看etcd 容器日志

docker logs -f etcd

在这里插入图片描述
此时发现了问题，服务器时间同步出现问题
使用如下命令同步时间，3台master节点均同步master01的时间

chronyc sources

在这里插入图片描述

最大的延迟有324ms，我们等了10分钟时间让时间去同步，之后再次查看

效果也不理想，再次查看日志，服务器还是报时间同步问题

此时我们猜想可能是系统资源不足引起的etcd读写吃力，最终难以同步
我们的服务器是8U32G ，所以内存和CPU是没有问题的，唯一出现问题的地方也就是磁盘io了，检测一下磁盘负载

iostat -x -k 1 1

在这里插入图片描述
我们看到确实是磁盘性能不足引起的 etcd无法同步，最终引起ETCD: request timed out

总结：etcd 是要进行大量读写操作的，磁盘io一定要跟得上，否则etcd不稳定，进而会引起kubernetes集群不稳定，进而引发业务不稳定一系列的问题。

etcd的硬件要求：
https://github.com/etcd-io/etcd/blob/master/Documentation/op-guide/hardware.md#disks
在这里插入图片描述

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。