在对计算节点进行维护时,通常会有重启动作,我有遇到一些问题,在这里总结下需要注意的几点:
1、在reboot节点前,需要stop掉该节点上面的所有虚机,如果不stop虚机,节点重启后,如果发生一些异常,会导致虚机进入error状态。
2、重启节点后,首先检查该节点上面所有docker服务是否都正常启动,如果有启动失败的,查明原因,待所有服务都正常运行后,再start虚机
1、在reboot节点前,需要stop掉该节点上面的所有虚机,如果不stop虚机,节点重启后,如果发生一些异常,会导致虚机进入error状态。
2、重启节点后,首先检查该节点上面所有docker服务是否都正常启动,如果有启动失败的,查明原因,待所有服务都正常运行后,再start虚机
3、如需迁移节点上的虚机,查找资源比较充足的机器作为目标机器,建议最好一个一个迁移,同时迁移可能会由于资源问题导致有些机器迁移失败