II.CHANGE QUANTIFICATION
论文:FluxRank: A Widely-Deployable Framework to Automatically
Localizing Root Cause Machines for Software Service Failure Mitigation 的 II. CHANGE QUANTIFICATION部分
CHANGE QUANTIFICATION说明
如前所述,在 change quantification阶段,我们尝试量化机器KPI的变化,这些变化由变化程度(change degree)衡量。change degree可用于在不同类型的KPI之间进行比较(例如,CPU利用率,内存利用率,I / O)。此外,发生服务故障时,根本原因主机的KPI将首先发生变化,然后是受此故障影响的主机的KPI变化。因此,变更开始时间(Tc)也有助于对根本原因机器进行定位。
显然, change quantification的设计目标是针对大量不同的kpi,快速准确地确定变更开始时间,并确定服务失败前后的变更程度。回想一下,传统的异常检测算法(例如[20-23])无法实现上述目标,因为它们在大量不同KPI的算法选择和参数调整中非常费力。因此,我们建议在变更量化中使用两步设计:(1)应用绝对导数确定变化开始时间;(2)使用核密度估计(KDE)确定变化程度。