VMware集群故障

最近遇到个奇葩问题,记录一下

客户环境:VMware+IBM DS5020存储

服务器:1(存疑),vSphere Client管理服务器,vcenter故障未用

问题:某数据库主机启动不了,提示“无法加载配置文件“/vmfs/xxx/xxxxx.vmx”。虚拟机配置无效。由于机房较远,远程配合客户进行处理。

处理经过:

        1.启动主机,一样的报错,一样的问题,配置各种检查没问题;

        2.连接存储,无报错,存储正常,磁盘和卷都正常;

        3.尝试新建主机,没问题;

        4.检查日志,发现存在存储空间用满的记录,客户删除了一些主机,空间恢复了30%左右,理论上空间是足够的。

        5.使用数据存储浏览器检查文件,发现打开故障主机文件时扫描比较慢,尝试复制虚拟主机vmdk文件到新文件夹下,提示文件xxxx.vmdk被锁定,无法访问;

        6.尝试下载vmdk到本地,跟5一样的提示,网上各种解决办法都尝试了依然没能解决。

各种尝试都没办法启动主机,后联系主机使用者看有无备份数据,考虑新建主机恢复主机。

主机使用者:“啊?不是已经恢复了吗,我这都正在连着数据库呢”。

一脸懵逼,我这主机都没启动,他咋连接的?

后来跟客户详细了解过,之前是做过集群的,只是有一台服务器挂了,vcenter就没再使用了。怀疑是挂掉的服务器启动了,尝试登录挂掉的那个服务器,果然能连接,而且,故障的主机正在那个服务器上运行着。。。

故障原因:故障节点启动,虚拟机漂移到故障节点启动,疑似vcenter管理的,但是vcenter已无法登录。

处理结果:修复vcenter,迁移主机回正常服务器,关闭故障节点电源,停用服务器。

故障根原因:VM集群内其他服务器启动,主机被迁移走,导致在某个节点下启动一直失败,如果使用vcenter管理,就很容易发现问题原因,不至于这么麻烦

  • 8
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
VMware安装故障转移集群是为了提高虚拟化环境的可靠性和可用性,当主机出现故障时,能够自动将虚拟机迁移到其他正常的主机上运行。以下是实施VMware安装故障转移集群的步骤: 1. 确保服务器硬件满足要求:首先,需要确保服务器硬件满足VMware故障转移集群的最低要求,例如CPU、内存和硬盘空间等。 2. 安装VMware vSphere:安装VMware vSphere软件,这是用于实现故障转移集群的核心组件。确保在所有主机上都正确安装并配置vSphere。 3. 配置共享存储:故障转移集群需要使用共享存储,如SAN或NAS,以便虚拟机可以在不同主机间迁移。配置并连接共享存储到所有主机上。 4. 创建故障转移集群:在vSphere控制台中创建故障转移集群,选择要包括的主机和共享存储。确保在设置中启用故障转移功能和可用性功能。 5. 配置网络:为故障转移集群配置网络设置,包括虚拟机网络和管理网络。确保网络设置正确并且各主机之间可以通信。 6. 设置故障转移选项和策略:根据实际需求,设置故障转移选项和策略,如迁移优先级、故障转移资源分配和故障转移触发条件等。 7. 测试故障转移:在配置故障转移集群后,进行测试以确保其正常工作。模拟主机故障或网络中断,观察虚拟机是否自动迁移到其他正常主机上并继续正常运行。 8. 监控和管理:定期监控故障转移集群的状态和性能,确保其稳定性和可靠性。根据需要,进行必要的管理操作和维护工作。 通过以上步骤,可以成功实施VMware安装故障转移集群,提高虚拟化环境的可靠性和可用性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值