VSAN故障案例分享——超经典三场景

前言:虽然个人认为现VSAN的常规运维都已经很成熟便捷了(像磁盘更换),但还是有诸多需要注意的地方。近期又突然跟VSAN项目有了一些交集,整理原有资料时,发现有几个不错的案例,故拿出来出大家分享下。如有不足之处,也希望大佬们帮指正。

 

-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

 

1.山西某大学商学院VDIIDV的项目(VSAN磁盘被写满问题

 

背景需求:150个用户的大电教习的上课VDI需求,需要能切换多个教学模版以满足不同环境的上课类型,并能一键切换到本地终端系统,以满足英语四六级口语考试和计算等级教室。

解决方案:VMware vsphere +VSAN +VDI产品 满足学生上课需求。 使用IDV产品方案满足本地终端的考试需求。

硬件平台:5台服务器+交换机+150个X86终端。(其中X86终端为双系统模式,既IDV+VDI双系统,可通过管理平台一键切换)

 

问题:收到代理商反馈学校VSAN群集内所有虚拟机近两个星期运行速度慢,已排服务器硬件,网络没有问题。

 

解决:1远程排查服务器硬件,网络正常。

2、检查vsan健康检查,有提示vsan容量使用告警信息。查看vsan容量,使用率接近90%。

3、与客户沟通了解,学校近期有新增开课班级。VDI桌面新增100多个。

4、检查学生个人数据盘占用大量空间(占VSAN总容量的30%)(且多为视频,MP3,游戏)。

5、临时解决方案,与学校老师沟通,清理部分学生的个人数据盘,释放空间。

6、最终解决方案,增加节点服务器,扩容VSAN容量总空间。

总结:

发生“vSAN磁盘写满”时应该做什么?

  • 关闭正在运行的vSAN释放vswap文件
  • 迁移VM到其他存储
  • 添加新的资源到vSAN当中,例如新的主机,新的磁盘。
  • (谨慎)调整VM的存储策略,例如从FTT=1到FTT=0,从"thick"调整到“thin”
  • 检查故障的主机/磁盘/磁盘组,尝试把他们恢复到正常状态
  • (谨慎)删除一些不重要的VM

如何避免类似的问题发生?

  • 确保vSAN有足够的使用可用空间(厂家建议使用率不超70%)
  • 培养良好的使用习惯,定期进行vSAN健康检查。

 

 

2.安徽某职业教育中心电教室项目(节点故障RAID卡故障,RAID0

 

背景需求:两个电教室共120多用户,需要满足高中专的教学需求。

解决方案:VMware vsphere +VSAN +VDI产品产品的解决方案

硬件平台:5台服务器做VMware vsphere +VSAN  +120台RAM架构终端

 

问题:收到学校老师反馈,VSAN容量变少,一台服务器开不了机。但学生机还可正常使用。

 

解决: 1、通过代理商与老师电话沟通,现VDI平台,VC平台正常,服务器没有配置远程BCM,老师对硬件也不熟悉

   2、学校出费用,打飞的,跑到现场。

  3、检查VC平台,故障主机状态为“未响应”。VSAN群集状态正常,FTT=1,

 4、检查服务器,不知名小厂家服务器,开机检查为RADI卡故障。更换同型号RADI卡

5、对照其他主机RAID信息,容量盘,缓存盘,均为RAID0配置。

6、沟通厂家,重做RAID,重装系统,重新添加到VSAN群集内

总结:

1、客户VSAN群集为BYO配置(用户自定义组合配置)多项VSAN健康检测告警。

2、RAID卡故障,且磁盘使用的RAID0

3、未使用正确IO控制器的配置方式

4、RAID0容量磁盘故障,增加运维风险,不能热插拔,需求通过RAID卡重做RAID0再加入

 

 

3.厦门某连锁品牌店 VSAN群集异常关机,断电,VCVSAN群集内

 

背景需求:原办工电脑老旧,需要利旧并满足150个用户的办工需求。以减轻维护人员的工作量并集中管理用户

解决方案: VMWare Vsphere +VSAN +windows AD 解决方案

硬件平台:4台服务器+网络+部分终端 +旧电脑利旧

 

问题:接到客户反馈,公司新机房断电,所有四台物理机已开机ESXI主机可ping通,但是VC,VDI桌面都无法登录。

 

解决: 1、远程登录,登录每台ESXI主机,查找确定VC所在位置

2、开启VC平台,并设置VC和VDI平台随主机启动。

3、检测VSAN群集状态,VSAN健康状态为正常

4、检测数据,正常

 

总结:本次问题有,VSAN群集异常断电恢复。VC在VSAN群集内。

1、同时为所有主机回电,

2、等待主机VSAN完成自检校验

3、检验完成前,不能SSH,Client端登录ESXI主机

4、VC在VSAN群集中需要有正确的开关机顺序

VCVSAN群集中关机顺序:

1、关闭除VC外的所有VM机器

2、关闭VC虚拟机,WEB页面将不可用

3、使用命令将所有ESXI主机进入维护模式

#esxcli system maintenancMode set -e true -m noAction

4、关闭所有主机

VCVSAN群集开机顺序

1、优先开启VC所在的ESXI主机,再开启所有其它ESXI主机

2、使用client登录VC所在ESXI,退维护模式,启动VC虚拟机

3、VC正常后,登录VC控制台,对其它ESXI主机退出维护模式

4、检测VSAN分钟状态。

5、开启其它VM

  • 5
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
《VMware vSAN 融合技术规划与部署》课程共分为“上集”和“下集”两部分,本套视频为“下集”部分,接续“上集”知识,是vSAN技术进阶推荐课程。  《VMware vSAN 融合技术规划与部署》“下集”部分具体课程章节如下。  第1章 《使用延伸群集将数据存储扩展到两个站点》主要内容本章主要讲解了vSAN延伸群集的相关理论及构建vSAN延伸群集的方法。通过本章学习,您可以掌握延伸群集的设计注意事项和推荐做法;掌握使用快速入门功能配置延伸群集的方法;掌握手动配置延伸群集的方法;掌握将延伸群集更改为标准群集的方法。  第2章 《vSAN延伸群集策略》主要内容本章主要讲解了vSAN延伸群集中的虚拟机存储策略。通过本章学习,您可以理解允许的故障数主要级别 (PFTT)含意;理解允许的故障数辅助级别 (SFTT)含意;通过试验进一步理解PFTT和SFTT含意;掌握将VM放置在首xuan站点和辅助站点操作过程。  第3章 《管理 vSAN 群集中的故障域》主要内容本章主要讲解了vSAN群集中的故障域相关理论和实践知识。通过本章学习,您可以了解故障域的设计思想;掌握在 vSAN 群集中创建新的故障域的操作方法;掌握将主机移出故障域的操作方法;掌握将主机移至选定的故障域的操作方法;掌握重命名故障域的操作方法;掌握移除选定的故障域的操作方法。  第4章 《管理 vSAN 群集》主要内容本章主要讲解了管理vSAN群集相关知识。通过本章学习,您可以理解什么是维护模式;掌握使用维护模式的操作方法;掌握将混合 vSAN 群集迁移到全闪存群集操作方法;掌握关闭 vSAN 群集电源的方法。  第5章 《使用 vSAN iSCSI 目标服务》主要内容本章主要讲解了在vSAN环境中配置iSCSI目标服务,以把vSAN数据存储提供给外部用户使用。通过本章学习,您可以掌握vSAN iSCSI 目标服务的设计思想;学会创建vSAN iSCSI 目标服务;学会使用客户端连接vSAN iSCSI 目标服务;掌握vSAN iSCSI 目标服务的使用方法。  第6章 《vSAN 群集中的设备管理》主要内容本章主要讲解了vSAN 群集中的设备(缓存盘和容量盘)管理。通过本章学习,您可以学会将设备添加到磁盘组的操作方法;学会从 vSAN 移除磁盘组或设备的操作方法;学会重新创建磁盘组的操作方法;学会使用定位符 LED的操作方法;学会将设备标记为闪存的操作方法;学会将设备标记为 HDD的操作方法;学会添加容量设备的操作方法;学会从设备移除分区的操作方法。  第7章 《提高 vSAN 群集中的空间效率》主要内容本章主要讲解了提高 vSAN 群集中的空间效率相关知识。通过本章学习,您可以了解vSAN 空间效率理论知识;掌握使用去重和压缩的操作方法;了解RAID 5 或 RAID 6 删除编码;了解RAID 5 或 RAID 6 设计注意事项。  第8章 《vSAN监控》主要内容本章主要讲解了vSAN监控相关知识。通过本章学习,您可以掌握监控 vSAN 群集的操作方法;掌握监控 vSAN 运行状况的操作方法;掌握监控 vSAN 性能的操作方法。  VMware vSAN 6.7 融合技术规划与部署(上集):https://edu.csdn.net/course/detail/35188VMware vSAN 6.7 融合技术规划与部署(下集):https://edu.csdn.net/course/detail/35191

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值