原因: 因为集群的一个节点主机,硬件有问题;时间长了温度过高系统会死机(因为有算法程序装了个比较牛皮的显卡); 需要卸掉网卡重新安装pve;
准备:
1、备份虚拟机配置与虚拟机;
tar zxcf pve2-qemu-server.tar.gz /etc/pve/nodes/pve2/qemu-server
注意: 首先得备份虚拟机数据存储;下面是存储盘的文件目录;
root@pve1:/data/kvm/sde1# ls
dump images lost+found private snippets template #这些是自己勾选可存储的类型
root@pve1:/data/kvm/sde1/images# ls #虚拟机列表
105 108 110 112
root@pve1:/data/kvm/sde1/images/105# ls #虚拟机镜像
vm-105-disk-0.qcow2
2、在master节点删除节点信息
pvecm delnode pve2 #删除节点pve2节点
3、查看配置信息
root@pve1:/etc/pve/nodes/pve2# cat /etc/corosync/corosync.conf |grep name
name: pve1
name: pve3
cluster_name: keya-pvecluster
#这里已经去掉了pve2节点信息;
4、在重新安全pve2节点的系统,然后可以在集群模块重新加入集群了;
5、恢复主机;
将之前备份的qemu-server信息,拷贝至/etc/pve/nodes/pve2/qemu-server
6、这样基本就完成操作了,可以直接重启虚拟机;