Rancher无法管理集群怎么办？RKE来接手！

Rancher by SUSE

于 2021-05-10 11:43:56 发布

阅读量959

点赞数 2

文章标签： kubernetes linux

本文链接：https://blog.csdn.net/RancherLabs/article/details/116231385

版权

前言

大部分Rancher用户倾向于通过使用Rancher Server创建自定义集群。而创建完成之后，也许会因为各种各样的原因导致 Rancher Server 无法继续管理该集群，比如误删 Rancher Server 或备份数据无法恢复等。遇到此类问题，通常的解决方案是重新启动一个 Rancher Server 并将下游业务集群导入并纳管，但这样会导致一些“后遗症”，比如无法继续扩展业务集群的节点。

为了消除这一“后遗症”的影响，我们可以通过RKE纳管Rancher Server 创建的“自定义”集群。

正如你所知，Rancher Server 通过 UI 创建的"自定义"集群，后端是通过 RKE 实现的，所以 RKE(https://docs.rancher.cn/rke/)有能力去纳管Rancher Server 创建的“自定义”集群。

通过RKE 创建和管理 Kubernetes 集群，依赖 3 个文件：

cluster.yml：RKE 集群配置文件
kube_config_cluster.yml：该文件包含了获取该集群所有权限的认证凭据
cluster.rkestate：Kubernetes 集群状态文件，包含了获取该集群所有权限的认证凭据

所以，只要能从下游业务集群中获得这 3 个文件，就可以结合 RKE 二进制文件继续管理下游业务集群。下面将详细介绍如何通过 RKE 纳管 Rancher Server 创建的“自定义”集群，并通过RKE扩展集群的节点。

演示环境

本文只针对 Rancher v2.4.x 和 v2.5.x 版本做了测试，其他版本可能不适用。

为了更好的演示效果，本文将从 Rancher Server 创建“自定义”集群开始，然后通过 RKE 纳管"自定义"集群，最后为了确认 RKE 有能力纳管集群，将演示通过 RKE 添加一个节点。

Rancher Server（ip-172-31-2-203）可以采用最简单的docker run方式启动，并通过 UI 创建一个"自定义"集群，集群中包括两个节点：ip-172-31-2-203和ip-172-31-1-111, 详细如下：

# kubectl get nodes
NAME              STATUS   ROLES                      AGE     VERSION
ip-172-31-1-111   Ready    worker                     2m2s    v1.18.14
ip-172-31-2-203   Ready    controlplane,etcd,worker   3m23s   v1.18.14

RKE纳管“自定义”集群

1、将ip-172-31-8-56 关机，模拟 Rancher Server 故障，此时无法通过 Rancher Server 继续管理下游集群。

2、恢复下游业务集群的kube_config_cluster.yml<

最低0.47元/天解锁文章

Rancher by SUSE

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
Rancher无法管理集群怎么办？RKE来接手！

前言大部分Rancher用户倾向于通过使用Rancher Server创建自定义集群。而创建完成之后，也许会因为各种各样的原因导致 Rancher Server 无法继续管理该集群，比如误删 Rancher Server 或备份数据无法恢复等。遇到此类问题，通常的解决方案是重新启动一个 Rancher Server 并将下游业务集群导入并纳管，但这样会导致一些“后遗症”，比如无法继续扩展业务集群的节点。为了消除这一“后遗症”的影响，我们可以通过RKE纳管Rancher Server 创建的“自定义”
复制链接

扫一扫