K8s集群重启与恢复-Master节点启停

临江仙我亦是行人

已于 2022-03-01 22:18:40 修改

阅读量2w

点赞数 9

分类专栏： Kubernetes 文章标签：分布式网络 linux

于 2022-03-01 21:59:42 首次发布

本文链接：https://blog.csdn.net/weixin_56752399/article/details/123217472

版权

1 应用场景

场景：在实际工作中，可能某个 Master 节点需要维护，迁移，我们需要平滑的停止、启动该节点，尽量减少启停中对集群造成的影响

注意：

为了确保 K8s 集群能够安全恢复，请在操作前对 K8s 数据进行备份
为了确保重启 Master 节点期间 K8s 集群能够使用，集群中 Master 节点数量要大于等于 3
若启停的 Master 节点上有 etcd 服务，在启停该 Master 节点期间，请勿对集群资源进行任何操作，包括添加、更新、删除等，否则会导致启停节点的 etcd 数据失效

2 操作步骤

2.1 备份数据

略，后续补充

2.2 停止 Master 节点调度

# 查看信息
kubectl get node
# 停止 Master 节点调度，停止后，上面已经运行的工作负载（Pod）不会受到影响，新的工作负载不会调度到该节点上
kubectl cordon sh-gpu101.aibee.cn
# 再次查看信息
kubectl get node

2.3

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

临江仙我亦是行人

关注关注

9
点赞
踩
35

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

记一次k8s上节点之间的flannel网络不通的情况

jalins的博客

08-06

6545

测试将fabric运行在k8s网络上的时候遇到一个flannel的网络问题：运行在k8s-node2上的pod连接不上运行在k8s-node1上的pod，报错如下： Error: error getting endorser client for channel: endorser client failed to connect to peer0-org1:7051: failed to create new connection: context deadline exceeded 首先想到的可能是我

K8s集群重启与恢复-Node节点启停

最新发布

qq_57150526的博客

04-01

542

重启k8s集群崩溃的一个可能解决方案

如何优雅关闭与重启生产级 Kubernetes 集群

easylife206的专栏

11-06

5144

公众号关注「奇妙的 Linux 世界」设为「星标」，每天带你玩转 Linux ！前言在日常对 Kubernetes 集群运行维护的过程中，您可能需要临时的关闭或者是重启 Kubernetes 集群对集群进行维护，本文将介绍如何去安全的关闭 K8s 集群以及如何重新启动集群。日常节点运维方式关闭 K8s 集群是个危险的操作！在关闭集群之前，您必须完全了解这个操作所带来的后果。首先，我们要对集群内的...

重启 k8s master 节点

fire_work的专栏

04-01

4140

kubeadm reset sudo rm -rf$HOME/.kube kubeadm init --kubernetes-version=1.18.1 --apiserver-advertise-address=192.168.8.45 --image-repository registry.aliyuncs.com/google_containers --service-cidr=10.10.0.0/16 --pod-network-cidr=10.122.0.0/16 --ignore-p...

k8s集群节点重启

m0_37732829的博客

03-04

2167

单节点单节点的k8s上具有两种角色，分别是master和worker 重启后状态正常，无影响多节点集群暂未测试，后续补录

K8s集群重启与恢复-Node节点启停方式例子解析

IT老农民的博客

10-07

2572

这是最简单的尝试方法，有时候可以解决临时的网络问题。如果重启服务没有解决问题，可以尝试以下步骤。：Docker 依赖于一个名为docker0的默认网桥来进行容器间的网络通信。创建网桥后，再次尝试启动 Docker 服务。：确保 Docker 的网络配置没有被错误地修改。如果没有列出任何网络，可能需要创建一个新的网络。然后重新创建网络并启动容器。：确保没有防火墙或安全组规则阻止 Docker 网络的正常工作。：如果进行了自定义配置，确保没有错误。配置文件通常位于。

如何重新启动k8s集群,并查看的状态

weixin_35755823的博客

01-12

4493

重新启动k8s集群的方法取决于您使用的部署方式。如果您使用的是kubeadm部署，可以使用以下命令重启集群: kubeadm reset kubeadminit 如果您使用的是其他部署工具，请按照该工具的说明操作。查看集群状态可以使用kubectl命令，如: kubectlget nodes 该命令会列出集群中所有节点的状态。 kubectlget pods --all-namespace...

【搭建k8s集群实战操作】十分钟快速搭建k8s集群模式-多master多node

05-06

* master：k8s master 节点 IP 地址 * node：k8s node 节点 IP 地址 * pkg-url：离线资源包地址 * version：资源包对应的版本增加 master 节点使用以下命令增加 master 节点： sealos join --master 192.168....

k8s node节点断电重启出问题；flannel重启失败 CrashLoopBackOff；flannel pod报错”Back-off restarting failed container” ；

01-07

问题如100字的题产生原因 kubeadm 装了k8s（各项指标正常）结果电脑蓝屏重启；kubectl get nodes 查看发现node节点都处于not ready 状态。解决过程进入节点，查看systemctl status docker; systemctl status kubelet; 发现docker好的，kubelet挂了。（如果docker挂了且一直卡starting状态，用journalctl -uf docker发现问题，如果问题都好的，再ps -ef docker 查看是否有父进程为1 的docker进程，有的话kill -9 docker进程id，有多少

K8S二进制部署---单节点master

.銀河狙擊手的博客

03-24

1856

一.环境准备　先准备3台主机，首先搭建Master单节点集群。　因为 Master 是整个 K8S 集群的大脑，没有 Master 接下来的每一步操作都会变得不可控。　　　　同时我们需要在节点上同时搭建 etcd 存储集群：　　　　在生产环境中会使用 etcd 集群做高可用，它的数目必须是3台或3台以上的奇数台。　　　　etcd 存储单独部署可以节约存储，和 Master 放在一起方便内网通信节约机器。　　　　只要能保证内网环境稳定和服务器数量充足，一般都会单独部署。 K8S 集群 Mas

k8s集群部署一个master节点，二个work节点

m0_72072537的博客

07-16

1715

这里执行完毕后可能遇到 calico 镜像ImagePullBackOff的问题，从以下链接中下载镜像上传服务器解压后，docker load 加载镜像。calico.yaml 文件添加以下两行，网卡使用ifconfig查看宿主机的网卡名称，我的宿主机的网卡名称是 ens33。出现上面照片的这句话，则说明主节点初始化成功，需要注意，要将这句话下面的打印内容全部复制出来留存，后续会用到。查看主节点状态不对，目前是NotReady，这个问题是因为网络组件未配置导致的，在主节点初始化日志中有这一步。

二进制部署k8s集群之master节点和etcd数据库集群（上）

2402_83805984的博客

07-29

1419

etcd默认使用2379端口对外为客户端提供通讯，使用端口2380来进行服务器间内部通讯。etcd 目前默认使用2379端口提供HTTP API服务， 2380端口和peer通信。

云原生Kubernetes：K8S集群各组件服务重启

cronaldo91的博客

09-30

3910

（1）Master端+Node共同服务。（2）Master端独有服务。（3）Node端独有服务。

3、使k8s集群重启后能正常使用

MonochromeContrast的博客

10-22

435

k8s在centos系统重启

重新启动K8S集群

学亮编程手记

05-16

5742

k8s集群宕机之后，恢复集群

热爱学习的哈哈哈的博客

12-28

1038

昨天由于服务器重启导致的；我有多台master服务器，理论上k8s集群应该不会挂，可能同时重启所有master服务器，导致k8s集群无法正常运行。或者是服务器宕机之后，导致的k8s集群挂掉。