xenserver VM假死

使用XenServer作为虚拟化平台,经常会有用户反映虚拟机会假死,并亮起非正常的Yellow图标。

a. 虚拟机不可用。这种现象发生的非常随机,发生在不固定的主机,不固定的虚拟机上。

b. 使用XenCenter无法正常的将其ShutDown,包括使用Force Shutdown。

c. 发生在XenServer的多个版本。相对比较集中在5.6~6.1之间。6.2SP1以后这个现象基本上没有再出现过。

d. 此问题多出现在Windows虚拟机上。

e. 比较容易出现在高负载的场景中。

在网上搜索一圈,找到的解决办法基本都是和Citrix的一篇官方KB一样:

[root@xenserver2 log]# xe vm-list
找到这台挂起的VM对应的UUID
[root@xenserver2 log]# list_domains
找出对应UUID的域ID

id | uuid | state
0 | eba679e5-022e-4419-b24b-38b34fb35fa9 | R
2 | 9100543a-719f-1fbb-6f48-e8ff110e1a0d | B H
3 | af09a76b-6918-c965-a178-52c258f44eec | B H
4 | e960d660-665a-dcb7-b080-3f384d35f96b | H
有问题的那台uuid的机器找到,状态是H

只能使用以下命令来强制销毁那个domain id 才能把有问题的那台虚拟机重启

[root@xenserver2 log]# /opt/xensource/debug/destroy_domain -domid XX
这个命令我猜应该是删除这台VM的外联存储(NFS、ISCSI等)
[root@xenserver2 log]# xe vm-reboot uuid=XXXX –force

XENSERVER在导出虚拟机时遇到的问题
和我遇到的情况一样,操作办法如下:

XenCenter的查看
勾选”隐藏的对象”
这时可以看到在宿主机下有一个灰色的名为”Transfer VM for VDI….”的虚拟机
右键关闭这个虚拟机
然后在本地存储中删掉即可
这时在看宿主机的磁盘空间已经释放了。

但是这些都没有从根本上解决这个问题。作为普通的IT人员,很难深层次去分析这个问题,仅以我个人了解的一些情况来尝试给出解决这个问题的一些思路。

首先得从XenServer的核心架构说起。任何一个操作系统都有一个核心来处理核心业务,所以也称为Kernal。这个在XenServer里面叫Dom0,而除去Dom0之外的其他虚拟机运行时占用的寻址空间叫DomU。

而在XenServer 6.5之前的架构中,所有的DomU的网络和存储的请求,都需要通过Dom0来完成。所以随着虚拟机的增加、负载越高Dom0的压力越大。所以在高密度、大负载的场景中,我们建议提高Dom0的vCPU数和内存大小。

那么这些和我们今天将的虚拟机假死有什么关系呢?个人认为:随着DomU越多,Dom0的压力越大。而且由于DomU的所有网络和存储请求都需要经过Dom0来调度,所以随着Dom0压力大,网络、存储是否能及时相应所有的请求就至关重要。

那么问题就来了,在出现这些问题的时候,事实上网络和存储的负载巨大多数情况下没有达到其物理硬件的瓶颈。那么问题出在了哪里了呢?

其实关键的问题就在于XenServer和网卡、存储HBA的驱动支持上。经过一些项目的合作,我们的硬件供应商发现在其服务器的日志中会有蛛丝马迹,这些问题很多时候是因为服务器上的网卡、HBA卡所使用的驱动和Firmware不是官方推荐的版本,或者版本过久。

其实这个也很好理解,当一个设备上的硬件所使用的驱动异常的时候,这个操作系统运行时轻则性能达不到标称值,重则不稳定甚至异常宕机。

所以当出现这种问题的时候,最应该优先尝试的步骤就是:

比如:用户使用的是一块Brodcome的10GB网卡,那么在hcl.xensource.com网站找到对应的网卡,就会显示出推荐的网卡驱动for XenServer链接。选择你对应的XenServer版本点击,然后下载安装即可。

当然support.citrix.com也会不定期更新最常见的各种驱动。并且类似于XenServer 6.2 SP1

这样的版本,会有专门的KB列出常用的硬件的驱动清单集,方便用户查询。

Driver Disks for XenServer 6.2.0 Service Pack 1 with Hotfix XS62ESP1009

最后,什么时候应该安装包括XenServer hotfix和硬件驱动更新包呢?

如果环境运行稳定,则无必要也无须做如上操作。

写在最后,XenServer从我个人来看,虽然在功能上与vSphere还有一定的差距,,但是如果严格参考XenServer的最佳实践来规划设计,其稳定性是在很多严苛的生产环境中验证过。

并且随着Citrix XenServer 6.5的发布,XenServer从内核Dom0的运行机制上将网络、存储等模块剥离出去,未来类似于这样虚拟机假死的现象虚拟机异常现象将会完全消失。而且无论从功能上、还是性能将会得到大幅度的提升。

在我看来XenServer 6.5才刚刚起步,未来的XenServer才会更加令人期待。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值