【编者按】
刘一蒙是vSAN的系统顾问,她做了一个关于vSAN监控和告警的很好的总结。
主要分为三部分:
1、利用vSphere web Client监控就能完成vSAN常用的监控和告警
2、利用vRealize Operations,可根据预先定义的策略自动采取措施
3、客户怎样将vSAN监控集成到自己的第三方监控工具里
---Begin---
为保证系统的稳定运行,存储系统应该具备实时监控系统的负载和故障情况的能力,管理员可以从vSphere web Client监控vSAN环境中的所有对象,包括参与vSAN集群的所有主机、设备以及vSAN Datastore的信息,如总容量、已用容量、预留容量、虚拟磁盘和VM Home以及Swap占用的容量、运行状态、物理位置等。
在日常运维中,如果采用精简配置,虚拟机的虚拟磁盘仅占用实际数据的使用空间,大量地节省了成本。但是,在无人监控空间增长的情况下,可能会发生存储空间超额分配,引发业务应用性能下降,甚至无法工作。
实际上,vSAN在任何磁盘设备利用率超过80%的容量阈值的时候,会自动在整个集群范围内执行容量的再平衡(Rebalance),以改善资源利用率。当磁盘容量全满时,vSAN会暂停写数据并为写请求申请新的磁盘空间。
当然,vSAN会尽量避免出现这样的情况,管理员可以从vSphere Web Client上实时监控vSAN Datastore的容量状态,并且提供了更简单的虚拟机对象消耗空间的监控方式,同时可以设置阈值向管理员发送告警通知。
vSAN为管理员提供了内置的默认警报,当警报对应的事件发生时,或满足警报中制定的一个或所有条件时,会自动触发默认警报,其中一个默认警报是磁盘上数据存储的使用情况,该警报用于监控磁盘使用情况的百分比,默认情况下,在超过75%使用空间的阈值时会触发一个黄色三角形的感叹号的警报(严重性级别:警告),当到达85%时会发出另外一个警告(严重性级别:严重),vSAN Datastore的虚拟机默认使用具有精简配置格式的虚拟磁盘,那么这种类型的警报更为重要。
对于默认警报,用户不能编辑条件或删除,如果要配置特定要求的警报,需要为vSAN创建自定义的警报。
第 1 步- 创建新的 vCenterServer 警报并命名,然后选择‘datastore’以及“Monitor specific event…(监控特定事件…)”,并确保已启用。
第 2 步– 为“事件”添加触发事件并修改阈值以满足用户定义的业务要求
第 3