vSAN其实很简单-如何处理“vSAN磁盘写满”问题?

 最近处理了一些关于“vSAN磁盘被写满”和“vSAN被撑爆”的问题。关于存储被用满的问题一直以来经常发生,不仅包括传统存储,甚至是个人笔记本也经常出现“榨干最后一兆空间”的事情。针对vSAN而言,这类问题不仅和用户平时的使用习惯有关,也与用户对vSAN的理解有限有关,所以借这个机会正好来谈一谈。

 

vSAN本身有哪些措施来平衡磁盘的使用率?

=========================

    我们先说下vSAN本身有哪些机制来平衡vSAN磁盘的使用率。

  • vSAN运行的过程中,在满足存储策略的前提下,vSAN会尽可能平均分布组件的存放位置,确保所有节点的所有磁盘的使用率大致相同。

(所有主机上的每个磁盘使用率基本相同)

 

  • 在任何一个磁盘的使用率超过80%时都会触发vSAN主动进行数据平衡来尽可能平均所有磁盘的使用率。

     

  • 在最大使用率磁盘和最小使用率磁盘差值超过30%,vSAN会提示可以手工触发磁盘平衡。

     

参考文档:

vSAN Health Service - Cluster health - vSAN disk balance (2144278)

vSAN Health Service - Physical Disk Health - Disk Capacity (2108907)

 

发生“vSAN磁盘写满”的原因?

=========================

    不过毕竟胳膊拧不过大腿,vSAN只能尽力确保磁盘使用率平衡。

(一个真实案例的vSAN磁盘写满的案例)

 

    发生“vSAN磁盘写满”主要是因为几个原因:

  • 虚拟机overprovisioning

    用户在部署虚拟机时候没有进行太仔细的使用空间的规划,虽然部署时可以正常的进行下去,但是随时使用时间越来越长,实际占用的空间越来越大,最终把vSAN撑满。

 

  • vSAN节点发生故障,但是vSAN没有足够的剩余空间去新建数据

    在发生硬件故障的场景下,例如主机离线,磁盘组离线甚至是网络分区,vSAN会在其他可用的节点上根据VM使用的存储策略重建数据副本。如果vSAN可用空间不够的话,那么在重建的过程中也会把vSAN撑满。

 

  • vSAN平衡时候产生临时文件

    vSAN 在平衡时会产生一些临时文件,如果vSAN本身使用率就非常高的话,在进行磁盘平衡的时候有可能把vSAN用满。

 

  • 用户忽略vSAN的告警

    一些用户没有定期检查vSAN健康检查的习惯,因此忽略了vSAN健康检查的告警,直到有一天创建VM时失败或者VM无法开机的时候才发现vSAN已经用满。

 

发生“vSAN磁盘写满”时对虚拟机有哪些影响?

=========================

  • 无法新建虚拟机

  • 现有虚拟机无法开机

  • 无法迁移VM到vSAN上

  •  Linux文件系统变为只读模式

  • Windows蓝屏

     

参考文档:

Linux based file systems become read-only (51306)

 

发生“vSAN磁盘写满”时应该做什么?

=========================

  • 关闭正在运行的vSAN释放vswap文件

  • 迁移VM到其他存储

  • 添加新的资源到vSAN当中,例如新的主机,新的磁盘。

  • (谨慎)调整VM的存储策略,例如从FTT=1到FTT=0,从"thick"调整到“thin”

  • 检查故障的主机/磁盘/磁盘组,尝试把他们恢复到正常状态

  • (谨慎)删除一些不重要的VM

  • (推荐)联系VMware技术支持

 

如何避免类似的问题发生?

=========================

  • 确保vSAN有足够的使用可用空间

    官方的建议是保持vSAN的使用率在70%左右(命令:df -h)。这当然不是说vSAN只能用70%的容量,而是防患未然,确保在发生主机故障时候vSAN有足够的空间进行数据重建。

 对于存放实际业务数据的任何存储来说,谨慎永远是最重要的!

*严格意义上来说,70%这个数值也不够严谨,而是应该以客户实际情况来计算出一个使用率。

 

参考文档:

https://docs.vmware.com/en/VMware-vSphere/6.7/com.vmware.vsphere.vsan-planning.doc/GUID-581D2D5C-A88F-4318-A8B3-5A5F343F1247.html

vSAN Health Service - Physical Disk Health - Disk Capacity (2108907)

 

  • 培养良好的使用习惯,定期进行vSAN健康检查。

    vSAN健康检查中Limits这里可以计算出一台主机故障后vSAN的使用容量。

 

  • 更新vSAN到最新的版本

    我们在新版本中优化了数据重建/同步的过程,可以减少同步数量和重建数据时临时文件的占用空间,类似的优化我们每个版本都会发布。

 

  • (个人经验) 主机上留下一个磁盘槽位,并且留下一块磁盘用于备件。

    如果出现问题可以快速添加存储资源。

 

  • 第一时间联系VMware技术支持

    在处理vSAN磁盘用满的故障时候,有些命令的使用其实是蛮有“讲究”的:不同的执行顺序就会有不同的结果。因此请第一时间联系VMware技术支持团队,让专业的人来做专业的事情。

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
VMware vSAN 超融合技术规划与部署》课程共分为“上集”和“下集”两部分,本套视频为“下集”部分,接续“上集”知识,是vSAN技术进阶推荐课程。  《VMware vSAN 超融合技术规划与部署》“下集”部分具体课程章节如下。  第1章 《使用延伸群集将数据存储扩展到两个站点》主要内容本章主要讲解了vSAN延伸群集的相关理论及构建vSAN延伸群集的方法。通过本章学习,您可以掌握延伸群集的设计注意事项和推荐做法;掌握使用快速入门功能配置延伸群集的方法;掌握手动配置延伸群集的方法;掌握将延伸群集更改为标准群集的方法。  第2章 《vSAN延伸群集策略》主要内容本章主要讲解了vSAN延伸群集中的虚拟机存储策略。通过本章学习,您可以理解允许的故障数主要级别 (PFTT)含意;理解允许的故障数辅助级别 (SFTT)含意;通过试验进一步理解PFTT和SFTT含意;掌握将VM放置在首xuan站点和辅助站点操作过程。  第3章 《管理 vSAN 群集中的故障域》主要内容本章主要讲解了vSAN群集中的故障域相关理论和实践知识。通过本章学习,您可以了解故障域的设计思想;掌握在 vSAN 群集中创建新的故障域的操作方法;掌握将主机移出故障域的操作方法;掌握将主机移至选定的故障域的操作方法;掌握重命名故障域的操作方法;掌握移除选定的故障域的操作方法。  第4章 《管理 vSAN 群集》主要内容本章主要讲解了管理vSAN群集相关知识。通过本章学习,您可以理解什么是维护模式;掌握使用维护模式的操作方法;掌握将混合 vSAN 群集迁移到全闪存群集操作方法;掌握关闭 vSAN 群集电源的方法。  第5章 《使用 vSAN iSCSI 目标服务》主要内容本章主要讲解了在vSAN环境中配置iSCSI目标服务,以把vSAN数据存储提供给外部用户使用。通过本章学习,您可以掌握vSAN iSCSI 目标服务的设计思想;学会创建vSAN iSCSI 目标服务;学会使用客户端连接vSAN iSCSI 目标服务;掌握vSAN iSCSI 目标服务的使用方法。  第6章 《vSAN 群集中的设备管理》主要内容本章主要讲解了vSAN 群集中的设备(缓存盘和容量盘)管理。通过本章学习,您可以学会将设备添加到磁盘组的操作方法;学会从 vSAN 移除磁盘组或设备的操作方法;学会重新创建磁盘组的操作方法;学会使用定位符 LED的操作方法;学会将设备标记为闪存的操作方法;学会将设备标记为 HDD的操作方法;学会添加容量设备的操作方法;学会从设备移除分区的操作方法。  第7章 《提高 vSAN 群集中的空间效率》主要内容本章主要讲解了提高 vSAN 群集中的空间效率相关知识。通过本章学习,您可以了解vSAN 空间效率理论知识;掌握使用去重和压缩的操作方法;了解RAID 5 或 RAID 6 删除编码;了解RAID 5 或 RAID 6 设计注意事项。  第8章 《vSAN监控》主要内容本章主要讲解了vSAN监控相关知识。通过本章学习,您可以掌握监控 vSAN 群集的操作方法;掌握监控 vSAN 运行状况的操作方法;掌握监控 vSAN 性能的操作方法。  VMware vSAN 6.7 超融合技术规划与部署(上集):https://edu.csdn.net/course/detail/35188VMware vSAN 6.7 超融合技术规划与部署(下集):https://edu.csdn.net/course/detail/35191
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值