虚拟机热迁移故障案例

九分横南

已于 2022-02-08 11:21:46 修改

阅读量2.3k

点赞数

分类专栏：运维 openstack 文章标签： linux openstack

于 2022-02-08 11:20:57 首次发布

本文链接：https://blog.csdn.net/qq_40742007/article/details/122820419

版权

运维同时被 2 个专栏收录

6 篇文章

订阅专栏

openstack

1 篇文章

订阅专栏

前言：

由于前期只有4台ARM主机，运行将近30台虚拟机，存在一定故障风险，后续扩容了部分主机，现计划热迁移大部分虚拟机，缓解主机资源紧张压力

故障原因：

由于迁移的虚拟机有部分内存使用率很高，导致热迁移实例写入内存页面的速度可能比复制它们的速度快，从而虚拟机产生了内存脏数据，无法完成迁移超时，虚拟机状态error

如何判断迁移超时：

首先虚拟机迁移失败，可查看当前迁移主机的nova-compute日志文件，通过虚拟机ID可以找到虚拟机日志

# grep d1df1b5a-70c4-4fed-98b7-423362f2c47c /var/log/nova/nova-compute.log
WARNING nova.virt.libvirt.migration [req-...] [instance: ...]
live migration not completed after 1800 sec

解决迁移超时：

如果想终止迁移任务，取消迁移热迁移，迁移虚拟机还在源主机

获取迁移ID
# nova server-migration-list 实例ID
取消迁移
# nova live-migration-abort 实例ID 迁移ID

如果想强制迁移，此时虚拟机将处于暂定状态，完成热迁移

# nova live-migration-force-complete 实例ID 迁移ID

如果在horizon看到虚拟机迁移过程电源状态异常，虚拟机状态异常

先将虚拟机状态设置为运行状态
# openstack server set –-state active 实例ID
将虚拟机关机
# openstack server stop 实例ID
将虚拟机开机
# openstack server start 实例ID

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

九分横南

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

Openstack: migration 虚拟机热迁移 失败的注意点

mzhan017的博客

02-01

1001

但是因为是一个失败的操作，可能数据记录已经处于一种中间状态，就是数据不完整，就可能造成任何可以出现的问题。失败之后VM还在运行，只是用lspci可以查看到设备，但是用ip命令查看网卡设备，确看不到。从这里也可以看出，在迁移的过程中，某些操作没有做完，而到了一种中间状态，导致数据不一致，最终efcount的数值出现异常。如果是按照正向的解决方法，应该就问题，查看openstack相关的代码。这种也是中间状态的一种表现。后续任何关于网络，设备的操作，都会让这个系统进入未知状态：hang主。

fusioncompute虚拟机存储迁移失败解决办法

weixin_43965805的博客

01-08

1597

具体故障描述 虚拟机存储迁移失败，重新执行迁移任务失败，后台查看对应块设备迁移进度为100%，实际迁移任务未完成，导致重新执行迁移任务失败。整体思路登录迁移源CNA节点，查看所有磁盘迁移进度通过脚本清理迁移任务前端重新执行迁移任务处理过程查看虚拟机ID virsh list 查看对应虚拟机的块设备 virsh domblklist 虚拟机id 查看对应块设备迁移进度 virsh blockjob 虚拟机id 对应块设备清理迁移失败磁盘...

参与评论您还未登录，请先登录后发表或查看评论

故障：OpenStack热迁移虚拟机失败

QwQNightmare的博客

03-09

994

故障：OpenStack热迁移虚拟机失败起因：在OpenStack中使用热迁移功能将虚拟机迁移至其他节点，结果操作失败。分析：在OpenStack群集之中，热迁移需要通过open vswitch建立二层的联系。所以在控制节点查看网络代理情况（neutron agent-list），结果发现open vswitch服务挂掉。处理：在相应的节点重启open vswitch服务，并再次查...

热迁移失败

qiongtianliuyun的博客

10-17

740

1、libvirt源端与目的端无法建立链接 Failed to connect to remote libvirt URI qemu+tcp 解决： a、与正常节点对比/etc/libvirt/libvirtd.conf的内容差异。 listen_addr = "::1;::1"是否注释 b、与正常节点对比/etc/sysconfig/libvirtd的内容差异。LIBVIRTD_ARGS="--listen" 参数是否打开参考：解决虚机热迁移失败的问题 ...

cpu差异造成的虚拟机迁移问题

qq_33881738的博客

03-10

3165

因为CPU指令集差异，造成虚拟服务器在线迁移失败。而通过CPU硬件底层支持的功能，可在虚拟层面上实现CPUID的掩码功能，通过该功能可屏蔽掉CPU指令集的不兼容子集，保留相互兼容的子集。这样就可在虚拟层面强制CPU指令集兼容。该过程可通过手工修改配置文件方式或增强型 vMotion 兼容性 EVC (Enhanced vMotion Compatibility)功能实现。其中，手工修改配置文件需要...

OpenStack平台虚拟机实例在线迁移失败问题

weixin_30553065的博客

07-20

368

一、在线迁移时提示如下的报错二、原因分析通过kolla-ansible部署queens版本时，因为OEM的机器设备的UUID记录的一致，导致迁移时识别的是自身机器的UUID，导致迁移失败三、问题解决修改ansible部署的playbook文件nova/tasks/config.yml nova/templates/libvirtd.conf.j2 转...

VMware虚拟机迁移成功案例与经验分享：迁移案例研究深入解析

[VMware虚拟机迁移成功案例与经验分享：迁移案例研究深入解析](https://img-blog.csdnimg.cn/img_convert/856cf6569236462f47eb07f8c76bc9df.jpeg) # 1. VMware虚拟机迁移概述 ## 1.1 虚拟机迁移的含义与重要性 ...

QNX Hypervisor热迁移技术：四大步骤实现虚拟机无缝迁移

本文旨在概述热迁移技术的基础理论和实施的关键步骤，分析实践案例及其故障排除，以及安全性与稳定性保障措施。同时，本文还将探讨热迁移技术的未来发展趋势，包括技术创新和在多个行业应用场景中的潜力。通过对QNX

【Linux虚拟化高级主题】：掌握虚拟机热迁移与高可用性架构设计

虚拟化技术是现代IT基础架构的关键组成部分，它允许在单一物理硬件上运行多个虚拟机（VM），从而更高效地利用计算资源。这不仅提高了硬件利用率，还带来了灵活的资源管理和快速部署新服务的能力。 ## 1.2 Linux...

数据迁移服务V200R100C00----VMware虚拟机数据迁移方案.doc

10-11

在这个案例中，迁移的对象是运行在VMware虚拟机上的数据。 1.2 读者对象该文档主要面向华为的工程师和合作工程师，为他们提供详细的步骤和指导，以确保VMware虚拟机数据迁移的顺利进行。 1.3 适用场景适用于需要...

KVM虚拟机无缝迁移秘诀：故障转移与恢复的5个关键步骤

[KVM虚拟机无缝迁移秘诀：故障转移与恢复的5个关键步骤](https://opengraph.githubassets.com/6008b6d4c8c719dcc66997b2921fa34ae167aa1cf1a3718d582234e0a539fa14/iamgagantyagi/KVM_VM_Migration) # 摘要 KVM...

关于OpenStack实例冷热迁移相关问题处理

SpiritedAway

10-24

2470

处理OpenStacks实例冷热迁移遇到的问题

FusionCompute中热迁移

qfy321的博客

04-23

1711

定义： 热迁移是将运行状态的虚拟机从一台主机迁移到另一台主机，迁移过程中业务不会发生中断在性能测试-可靠性测试中有针对虚拟机迁移的测试，包括热迁移，迁移，迁移时长，业务中断时长等。 虚拟机热迁移过程中使用内存数据快速复制及共享存储的技术，确保虚拟机迁移前后数据不变 热迁移包括虚拟机热迁移和磁盘热迁移 虚拟机热迁移类型分为更改主机、更改数据存储以及更改主机和数据存储冷迁移是将停止状态的虚拟机从一台虚拟机从一台主机迁移到另一台主机，迁移过程中会发生中断。为什么不点赞呢？是我写的内容不

OpenStack调整实例大小迁移失败的问题

最新发布

一條默默無聞的鹹魚的博客

04-26

780

OpenStack调整实例大小迁移失败。

虚拟机迁移pause状态，后续迁移pause疑惑

wllabs的专栏

08-05

1387

今天有人在测试虚拟机迁移，说pause状态了，我马上上去看，一看确实是pause状态，马上去/var/log/libvirt/qemu里看qemu的日志，可是发现qemu日志里竟然没有任何报错。同时报警群里报了个error，说迁移的时候没有触发suspend事件。这个就比较严重了，如果没有触发suspend事件，可能会导致其它依赖这个事件的一些操作没有完成。好在我们...

OpenStack future live-migration

第十六维

08-25

827

Operators loves to kill a live migration How to abort an in-progress live migration nova live-migration-abort •Abort the running job and triggers a rollback •Works only when libvirt is used as a

一次虚拟机热迁移失败处理，使用nova live-migration-force-complete强制暂停下虚拟机

Focus on k8s and python

10-02

4971

客户反馈2台虚拟机热迁移失败，检查源计算节点的nova-compute日志，均发现live migration stuck xxx sec的错误信息。 虚拟机热迁移的过程，在源节点和目标节点会有同步虚拟机内存的操作，查看stuck日志之前的输出，问题memory 基本0% remaining，问题应该在最后一刻同步内存。于是尝试使用nova live-migrat...

为什么我的虚拟机热迁移那么慢？原来热迁移速度跟这两个因素息息相关！

运维少年

02-10

3103

一、虚拟机迁移类型虚拟机迁移一共有两种类型，分别是冷迁移和热迁移。冷迁移需要在虚拟机关机状态下进行，所以冷迁移会中断业务；热迁移支持虚拟机在开启状态下进行迁移，迁移过程中用户基本无感知(非绝对)。1.1 冷迁移冷迁移流程大致可以分为两个步骤，一是迁移，二是确认。冷迁移和resize是一样的流程。大致流程如下(以共享存储为例...

nova 命令演示

yongwan5637的博客

04-22

4008

——nova命令解释首先，通过nova-manage version查看nova版本 2014.2.3 #nova --version 2.20.0 运行nova help 命令，可以得到如下信息： nova help usage: nova [--version] [--debug] [--os-cache] [--timings] [--timeout <...