虚拟机未HA

文章讲述了服务器因内存错误导致异常重启,同时虚拟机HA功能受阻。通过检查NovaHA配置、确认探测VLAN的启用和有效性,发现AC逻辑端口未正确配置是问题根源。解决方法是调整AC端口设置并验证,最终成功实现虚拟机HA。
摘要由CSDN通过智能技术生成

问题描述

一台服务器由于一根内存条初始化错误,引起服务器异常重启,但该服务器上的4台虚拟机未能HA到该区域的其他主机。

原因定位

1、检查cps界面,配置->openstack->nova->虚拟机HA功能开关,是否打开

2、Type2场景,开启HA功能开关情况下是否配置了探测VLAN(未配置探测VLAN,在虚拟机HA时可能造成虚拟机脑裂。)

2.1、检查cps界面,配置->网络->物理网络配置,检查业务面物理网络探测vlan是否已填写,打开ha的时候必须开启探测vlan。(XX局点已配置)

image.png

2.2、测试探测vlan是否生效:

测试方法:找一个运行状态的虚拟机,记录虚拟机id,并编辑执行以下命令进行测试:

python /etc/fusionnetwork/oam-network-agent/provider_ping.py '{"provider_name": ["physnet2"],"vm_uuid": "0e1c002a-986f-4bfb-b5a4-882069a2189e"}'

注意:provider_name为虚拟机使用的物理网络平面,vm_uuid为虚拟机id,脚本不能在虚拟机所在的主机上执行,如果结果返回ok表示vlan已生效,bad表示探测vlan未配通。

以下为测试结果:返回结果为bad,表示探测vlan未生效故无法进行HA

image.png

3、探测vlan未生效原因定位

通过检查AC发现,计算节点上连业务交换机时,未在AC侧配置相应逻辑端口(计算节点物理端口连接交换机物理端口需要和AC上的逻辑端口连接的逻辑交换机一一对应)

image.png

A19-1-0-1至A19-1-0-10以及A19-2-0-1至A19-2-0-10逻辑端口均为下线状态 A19-1-0-11至A19-1-0-20以及A19-2-0-11至A19-2-0-20逻辑端口均未添加

原因由于在前期交付时挪过线缆,互联网计算节点的物理端口从交换机1-10挪到了11-20,而后期未在AC中将11-20端口添加进来,故而导致业务交换机未放通探测VLAN,从而导致该端口下联的主机上的虚拟机无法HA

解决方法

在AC添加相应的逻辑端口(A19-1-0-11至A19-1-0-20以及A19-2-0-11至A19-2-0-20)后,业务交换机放通了探测VLAN,探测VLAN生效

以下为配置后的逻辑端口,端口状态均为上线状态

image.png

测试验证

将相关联的逻辑端口添加上后,对11-20端口下联的主机中的虚拟机做HA测试,得出以下测试结果:

返回结果为OK,表示该虚拟机可HA到其他主机。

  • 7
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值