心跳超时时间设置_OpenShift 4中etcd同步时间的调整

本文介绍了OpenShift 4环境下,由于网络延迟可能导致的etcd集群不稳定问题。建议的解决方案是调整ETCD_ELECTION_TIMEOUT和ETCD_HEARTBEAT_INTERVAL参数,以适应网络条件。详细探讨了这两个参数的合理取值范围,并提供修改etcd静态Pod配置的方法,确保参数在重启和删除Pod后仍有效。然而,升级OCP集群会重置这些设置,需要重新调整。
摘要由CSDN通过智能技术生成

本文仅代表大魏的个人观点,生产环境请以红帽实施团队的官方观点为准。

OpenShift Etcd集群每隔100ms会检测心跳。如果OpenShift的环境网络条件差,Master节点之间网络延迟超过100ms,则可能导致群集中的不稳定和频繁的leader change(详见https://access.redhat.com/solutions/4885601)。Etcd Leader的选举,默认必须在1s之内完成,否则OpenShift集群为了保护etcd数据的一致性,将暂停对集群的配置更改类操作。出现如下报错:

ac09e0bcd95d64cb7062855b5522ec72.png

查看etcd的日志,可以看到如下内容(网络延迟过大,造成etcd member无法同步)

1b2effce66034b8a2a6b1d328c080261.png

此外,存储的超时也会对Etcd造成严重影响。要排除磁盘缓慢导致的Etcd警告,可以监视指标backend_commit_duration_seconds(p99持续时间应小于25ms)和wal_fsync_duration_seconds(p99持续时间应小于10ms)以确认存储速度正常(详见https://access.redhat.com/so

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值