etcd
文章平均质量分 63
CSH056
这个作者很懒,什么都没留下…
展开
-
etcd成员报空间不足问题处理过程
一、场景描述用户无法正常访问部署在k8s上的服务和使用我们的PaaS平台。二、问题描述某环境的etcd集群全部挂掉,导致k8s集群部署的服务都无法正常提供使用,查看etcd状态和报错日志,如图所示:图中报错显示etcd成员的空间不足三、问题处理过程描述当时根据etcd的报错日志,先到对应的主机查看了下磁盘和内存的使用情况,发现etcd所在的主机资源都是充足的,然后一起重启了下三台etcd,发现还是没能解决,看来万能的重启不能解决了,看看日志还是报etcd成员的空间不足,看了下etcd的官方文档;原创 2021-04-12 14:07:51 · 3418 阅读 · 0 评论 -
ETCD备份恢复脚本
etcd备份恢复原创 2023-03-13 16:24:36 · 407 阅读 · 0 评论 -
对etcd进行数据拆分
我们现在是一个k8s集群,多个租户共同使用,包括如果后期有新用户上云,申请到的资源同样也会以node节点的形式加入到现有的master节点,这样当一定规模的服务运行在集群中,势必会增加etcd的负担,整个ku8集群的数据都是存放在etcd中,只有进行合理的拆分,才能提升etcd的性能。进行etcd拆分的情况如下图:老版本的etcd仍然提供服务,只存储pod、svc等信息。新版本的etcd提供着存储ku8的events信息。之前就是因为把所有数据存放到一套etcd集群,出现events信息太多导致et原创 2022-04-24 14:21:44 · 1023 阅读 · 1 评论 -
通过etcd去删除kubernetes的资源对象
我们有时会遇到在kubernetes集群中,一些挂掉的pod或者其它资源对象无法正常的删除的时候,我们可以通过etcd去进行删除操作。首先我们需要先到etcd的库中查找我们想要的资源对象:ETCDCTL_API=3 etcdctl get “/registry” --prefix --keys-only | sed ‘/^\s*$/d’接着可以根据查找到的资源对象进行一个删除操作,比如我需要删除一个资源分区:ETCDCTL_API=3 etcdctl del /registry/namespaces原创 2021-04-22 15:50:08 · 1007 阅读 · 0 评论 -
etcd的三种数据迁移方式
目前我们在推动租户上云的过程中,kubernetes集群的规模越来越大,对于整个集群的稳定性来说,肯定是不言而喻的,我这边维护上云租户使用的kubernetes集群基本上都是采用的虚拟机,各个项目规模达到一定规模,就会首当其冲出现etcd的性能问题,针对这个问题我们对etcd采取了迁移到好的裸金属主机上或者在虚拟机上挂上块存储,以下介绍我们在生产环境上执行etcd的三种迁移方式。情景一、三台etcd集群所在目录的磁盘性能达不到,分别在三台etcd的虚拟机上单独挂载快存储提供给etcd使用,数据迁移操作如原创 2021-04-02 13:00:36 · 5910 阅读 · 9 评论 -
etcd的调优
etcd中的默认设置对于在平均网络等待时间很短的本地网络上的安装应该可以很好地工作。但是,当在多个数据中心或具有高延迟的网络上使用etcd时,心跳间隔和选举超时设置可能需要调整。网络不是延迟的唯一来源。引导者和跟随者上的慢速磁盘可能会影响每个请求和响应。这些超时中的每一个代表从另一台机器请求到成功响应的总时间。时间参数基本的分布式共识协议依赖于两个单独的时间参数,以确保节点在一个停滞或脱机时可以移交领导权。第一个参数称为心跳间隔。领导者将以此频率通知关注者它仍然是领导者。为了获得最佳实践,应围绕成员之转载 2021-03-30 14:50:58 · 1015 阅读 · 0 评论