一、集群升级
k8s 1.18.10->1.19.6
rke 1.11->1.2.4
1、集群部署:https://blog.csdn.net/weixin_47003048/article/details/109485358
2、下载新的rke 1.2.4版本
wget https://github.com/rancher/rke/releases/download/v1.2.4/rke_linux-amd64
mv rke_linux-amd64 /usr/bin/rke-1.2.4
chmod a+x /usr/bin/rke-1.2.4
3、查看rke 1.2.4支持的k8s版本
rke-v1.2.4 config --list-version --all
v1.19.6-rancher1-1
v1.18.14-rancher1-1
v1.16.15-rancher1-3
v1.17.16-rancher1-1
4、修改cluster.yml中集群版本为kubernetes_version: “v1.19.6-rancher1-1”
5、在cluster.yml同级目录执行升级命令(建议升级前针对集群做数据备份)
rke up
6、检查升级版本是否正确,集群状态和服务是否正常
kubectl version
kubectl get cs
kubectl get pod --all-namespaces
二、集群备份恢复(pv内数据未备份,不涉及到数据卷恢复)
1、备份(在cluster.yml同级目录)
rke-v1.2.4 etcd snapshot-save --name 20210121-test.db
2、模拟删除
kubectl -n kube-system delete deploy metrics-server
3、恢复
rke-v1.2.4 etcd snapshot-restore --name 20210121-test.db
4、检查集群、服务是否恢复正常,pod重启是否正常
kubectl get cs
kubectl get pod --all-namespaces
kubectl -n kube-system get pod|grep metrics-server|awk '{print $1}'|xargs kubectl -n kube-system delete pod