Vsphere集群报主机隔离故障

故障描述

收到告警工单,vc报主机32与某集群中的master主机丢失联系,处于不同的网络分区;查看vc事件台,发现告警如下:
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
故障集群有4台主机,分别为2,3,4,5主机。

分析

1、网络隔离:即集群中master主机可以通过共享存储检查到某从属主机存活,但是无法通过管理网络进行ping监测,且从属主机无法ping通故障隔离ip地址,故障主机代理无响应,从属主机声明主机被网络隔离。一般只要有一条上行链路正常,很少出现网络隔离
2、网络分区:集群中从属主机失去与首选主机(主代理主机)的网络连接,即通过管理网络无法ping通;
3、从事件记录里看,首先32主机HA代理报可用性无法访问,此时主代理主机为34;随后报出34主代理master主机与集群其他主机管理网络不通;接着报出32主机与集群中其他主机处于不通的网络分区中;第4步报32主机已从34主代理【分区】;5报32主机无法与隔离地址89.254通信;6报32主机HA可用性状况为:网络已隔离,主机上虚拟机断开,主机无响应,最后32主机恢复代理状态和从属角色,恢复连接,相关虚拟机启动,
3、从事件中查看,32主机网络管理端口处于down状态;
4、登录故障主机ipmi管理地址,检查确认网络硬件接口状态;
5、vc网路的交换机中检查上链线路端口状态。

处理

将故障主机置于维护模式,故障端口置于备用,或者直接将故障主机从当前集群中临时剔除,当恢复后重新加入;完成后联系主机运维同事检查32主机网卡接口状态。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
vSphere 故障排除》介绍了 vCenter Server 实施及相关组件的故障排除问题和过程。 A Active Directory 24 Auto Deploy 超时错误 18 重定向问题 19 coredump 20 错误的映像 18 DHCP 地址 22 故障排除 18 TFTP 服务器 21 网络引导问题 22 无法完成引导 20 无法引导 21 映像配置文件警告 19 Auto Deploy 升级 23 C 插槽大小 35, 36 插件, 故障排除 34 超时错误, Auto Deploy 18 CHAP 身份验证 56 重复会话错误, vSphere Web Client 31 config.vpxd.das.electionWaitTimeSec 39 存储 DRS 错误 52 放置位置 53 关联性规则 52 规则违反 52 故障排除 49 建议 53 禁用 52 OVF 模板 52 删除关联性规则 52 无法应用建议 53 已禁用 49 存储 DRS 建议, 故障排除 53 存储故障排除 55 存储设备, 显示问题 55 存储适配器, 故障排除 62 D 导出许可证使用情况 80 登录, vSphere Web Client 31 Disk.SchedNumReqOutstanding 60 Distributed Switch, 无法移除主机 68 低吞吐量, Windows 虚拟机 73 地址已在使用中, Jetty 服务器 30 DNS 31 队列深度 58, 59 F 防火墙 基于网络 33 Windows 32 Fault Tolerance 故障排除 7–9 日志记录 10 Fault Tolerance 故障排除 7 非 ASCII 字符 61 分布式端口组, 虚拟机无法通信 75 flash player, 内存不足 30 ft.maxSwitchoverSeconds 8 辅助虚拟机 39, 40 G 高级设置, Disk.SchedNumReqOutstanding 60 高级运行时信息 36 功能 81, 82 gpupdate /force 命令 31 GUID 31 孤立的虚拟机, 恢复 12 过载的主机 8 故障排除 插件 34 扩展 34 链接模式 31 USB 设备 10, 11 vCenter Server 27 vCenter Server Appliance 28 vSphere Web Client 27, 29 证书 33 故障排除许可 77 故障切换, 已断开虚拟机连接 71 H HBA, 队列深度 58 合规性故障, 主机配置文件 24 红色群集 35
《企业级 VMware vSphere 6.7虚拟化技术配置与管理》课程共分为“上集”和“下集”两部分,本套视频为“下集”部分,“上集”部分已经对VMware vSphere 6.7的计算资源、网络资源、存储资源、虚拟机配置与管理等进行了详细讲解,“下集”部分以“上集”为基础进行技术延伸,全面对vMotion、DRS、HA、FT、性能监控、VDP备份等特性进行理论讲解和实战配置。 通过本课程学习,可以全面掌握vMotion、资源池、DRS、HA、FT、VDP、监控等高可用性运维技能。 《企业级 VMware vSphere虚拟化技术配置与管理》下集部分具体课程章节如下。 第1章 《VMware vSphere 6.7 vMotion配置与管理》主要内容本章我们详细介绍了冷迁移、通过 vMotion 迁移、通过 Storage vMotion 迁移、CPU 兼容性和 EVC、在 vSphere Client中迁移已关闭电源或已挂起的虚拟机、将开机状态的虚拟机迁移至新计算资源和存储、关于迁移兼容性检查等内容。希望大家在掌握理论的基础上,跟做课程中涉及的每一个实验,达到融会贯通的效果。 第2章 《VMware vSphere 6.7 资源和DRS配置与管理》主要内容本章我们主要讲解了CPU虚拟化资源管理知识、内存虚拟化资源管理知识、存储虚拟化资源管理知识、资源池、DRS群集、Storage I/O Control、科学合理的进行资源分配相关理论和操作。希望大家在掌握理论的基础上,跟做课程中涉及的每一个实验,达到融会贯通的效果。 第3章 《VMware vSphere 6.7 HA配置与管理》主要内容本章我们主要讲解了业务连续性和最小化停机时间、vSphere HA 的工作原理、vSphere HA 准入控制、vSphere HA 互操作性等知识。通过实践操作,可以掌握创建 vSphere HA 群集,配置 vSphere HA群集,配置 Proactive HA。为了提高vCenter Server的高可用性,讲解了vCenter High Availability知识。希望大家在掌握理论的基础上,跟做课程中涉及的每一个实验,达到融会贯通的效果。 第4章 《VMware vSphere 6.7 FT配置与管理》主要内容本章我们从理论上讲解了Fault Tolerance 的工作原理、Fault Tolerance工作用例、Fault Tolerance 环境要求、限制和许可、Fault Tolerance 互操作性。以理论为基础,实践了打开Fault Tolerance功能、测试Fault Tolerance故障切换、迁移辅助虚拟机、挂起Fault Tolerance、恢复Fault Tolerance、关闭Fault Tolerance等内容。最后总结了使用Fault Tolerance的科学做法、Fault Tolerance的故障排除方法。希望大家在掌握理论的基础上,跟做课程中涉及的每一个实验,达到融会贯通的效果。 第5章 《VMware vSphere Data Protection(VDP)》 主要内容本章我们从理论上讲解vSphere Data Protection的基本功能、体系架构。演示了VDP的安装和配置,讲解了怎样正确使用VDP以及使用VDP进行管理备份,自动备份验证,管理恢复,复制作业,文件级恢复,紧急恢复,VDP代理等相关功能,最后针对VDP常见故障进行了总结分析。希望大家在掌握理论的基础上,跟做课程中涉及的每一个实验,达到融会贯通的效果。 第6章 《VMware vSphere 6.7 监控和性能》 主要内容本章我们从理论上讲解了vSphere监控、性能、日志等相关基本知识。实践操作了使用性能图表监控清单对象、监控事件和警、系统日志文件的配置。希望大家在掌握理论的基础上,跟做课程中涉及的每一个实验,达到融会贯通的效果。 企业级 VMware vSphere 6.7虚拟化技术配置与管理(上集)视频课程:https://edu.csdn.net/course/detail/35162企业级 VMware vSphere 6.7虚拟化技术配置与管理(下集)视频课程:https://edu.csdn.net/course/detail/35171

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

羌俊恩

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值