vSAN 内存或 SSD 拥堵已达到阈值限制 (2071384)
https://kb.vmware.com/s/article/2071384?lang=zh_cn
Last Updated: 2020/2/7Categories: TroubleshootingTotal Views: 453Language: Chinese (Simplified)JapaneseEnglish subscribe
Details
免责声明:本文是 vSAN memory or SSD congestion reached threshold limit 的翻译版本。尽管我们会不断努力为本文提供最佳翻译版本,但本地化的内容可能会过时。有关最新内容,请参见英文版本。
摘要
当 vSAN 群集的 ESXi 主机确定内部 vSAN 内存 (LSOM) 或闪存 (SSD) 设备已超出预定义的拥堵阈值时,您会收到此警示。此警示的示例包括:
LSOM Memory Congestion State: Exceeded.拥堵阈值: 200 Current Congestion: 201.
LSOM SSD Congestion State: Exceeded.拥堵阈值: 200 Current Congestion: 201.
当存储子系统中较低层的 I/O 速率跟不上较高层的 I/O 速率时,vSAN 中会发生拥堵。
Local Log Structured Object Management (LSOM) 是 vSAN 的内部组件,在物理磁盘级别(闪存设备和磁盘)运行。LSOM 还为组件处理读取缓存和写入缓冲。
SSD 是 vSAN 磁盘组的缓存设备。
当 vSAN 人为地在虚拟机中引入延迟以降低写入单个或多个闪存设备层的速率时,会出现 LSOM 内存拥堵状态和 LSOM SSD 拥堵状态。
影响
在出现拥堵的时段内,虚拟机出现较高的延迟。由于 vSAN 使用限制机制来确保所有层都以相同的 I/O 速率运行,可能会发生短时间拥堵。
最好对拥堵设置较小的值,因为较高的值意味着延迟。不过,持续拥堵并不经常遇到,大多数情况下,几乎没有拥堵。
Solution
如果虚拟机执行大量的写入操作,闪存缓存设备上的写入缓冲区可能会填满。这些缓冲区必须降级转储到混合配置中的磁盘。只能以混合配置中的磁盘可处理的速率执行降级转储。
其他拥堵原因可能与以下情况有关:
- 硬件故障
- 驱动程序或固件损坏或运行不正常
- I/O 控制器队列深度不够
- 处于指定 vSAN 部署中
SSD 日志积累可能导致 VMware vSAN 群集性能低下 (2141386) https://kb.vmware.com/s/article/2141386
注意:
当拥堵级别跌回到低于阈值后,ESXi 会生成以下类型的事件:
LSOM Memory Congestion State: Normal. congestion Threshold: 200 Current Congestion: 190.
LSO SSD Congestion State: Normal.拥堵阈值: {3} Current Congestion: 190.
要监控 vSAN 拥堵阈值,请参见 Adding alarms to vCenter Server for VMware vSAN monitoring (2091347).
可以使用 vSAN 运行状况检查监控 vSAN 的拥堵状况。但是,如果遇到拥堵程度超过阈值的情况,则应尽快向 VMware 技术支持提交服务请求。