K8s集群重启与恢复-Master节点启停

1 应用场景

场景:在实际工作中,可能某个 Master 节点需要维护,迁移,我们需要平滑的停止、启动该节点,尽量减少启停中对集群造成的影响

注意

  1. 为了确保 K8s 集群能够安全恢复,请在操作前对 K8s 数据进行备份

  2. 为了确保重启 Master 节点期间 K8s 集群能够使用,集群中 Master 节点数量要大于等于 3

  3. 若启停的 Master 节点上有 etcd 服务,在启停该 Master 节点期间,请勿对集群资源进行任何操作,包括添加、更新、删除等,否则会导致启停节点的 etcd 数据失效

2 操作步骤

2.1 备份数据

略,后续补充

2.2 停止 Master 节点调度
# 查看信息
kubectl get node
# 停止 Master 节点调度,停止后,上面已经运行的工作负载(Pod)不会受到影响,新的工作负载不会调度到该节点上
kubectl cordon sh-gpu101.aibee.cn
# 再次查看信息
kubectl get node
2.3 驱逐 Master 节点上的工作负载
# --ignore-daemonsets 驱逐 pod 时忽略 daemonset
# --delete-local-data 驱逐 pod 时删除 pod 的临时数据
kubectl drain sh-gpu101.aibee.cn --delete-local-data --ignore-daemonsets --force

查看节点上是否还有业务 pod

kubectl get pod -A -o wide |grep sh-gpu101.aibee.cn
2.4 停止 Master 节点
# 注意顺序
systemctl stop kubelet 
systemctl stop etcd 
systemctl stop docker

如果不想恢复使用,删除节点并确认节点信息

kubectl delete node sh-gpu101.aibee.cn
kubectl get node
2.5 恢复 Master 节点
# 注意顺序
systemctl start docker
systemctl start etcd
systemctl start kubelet
systemctl status docker etcd kubelet
2.6 允许 Master 节点调度
# 取消不可调度
kubectl uncordon sh-gpu101.aibee.cn
  • 6
    点赞
  • 32
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值