数据驱动应用（五）：基于时间序列数据的异常识别模型

最新推荐文章于 2024-09-13 08:00:00 发布

DanielJyc

最新推荐文章于 2024-09-13 08:00:00 发布

阅读量2.1k

点赞数 2

分类专栏：数据驱动

本文链接：https://blog.csdn.net/qq496830205/article/details/107290363

版权

本文介绍了基于时间序列数据的异常识别模型，通过计算器进行特征变量处理和转换，使用异常检测器判断突变。计算器包括累积窗口均值、趋势性和周期性计算器，异常检测器由比较器和决策器组成，用于判断数据异常。异常检测阈值的选取至关重要，模型的应用和故障止损策略也进行了讨论。

摘要由CSDN通过智能技术生成

1. 概述

大型集群系统中，可能存在软件问题和硬件问题导致的系统故障，严重影响了系统的高可用性。这就要求7*24小时，对系统不间断监控。这就意味着需要不间断地监控大量时间序列数据，以便检测系统潜在的故障和异常现象。然而，实际当中的系统异常很多，且不容易发现；从而导致人工方式监控方式效率很低。

异常场景本质上是一个或者多个数据点；数据点一般在系统运行过程中产生，且能反应系统的功能是否正常，多以日志形式呈现。当系统功能发生异常时，就会产生异常数据。快速高效地发现这些异常值，对于快速止损具有重要意义。对此，我们提出一种基于时间序列的异常识别模型，用来及时发现异常。

对于多数系统，一般都有成功率、流量等指标，故障发生时，这些指标也会出现响应的异常。我们将系统成功率、流量统一称为特征值变量，并对其进行建模，从而方便后续其它特征变量的扩展。为了更好地感知这些特征变量的突变，需要对特征变量进行计算处理或者空间转换。那么异常识别问题就转换为以下两个问题：

特征变量的计算处理和转换
突变的判断

针对这两个关键问题，我们将在下文中进行建模和分析。

2. 异常识别

如下图，通过计算器进行特征变量的计算处理和转换，通过异常检测器来判断数值的突变，从而解决上面的两个问题。其中，异常检测器由比较器和决策器组成。
在这里插入图片描述
对于给定时间序列二维矩阵 $X=\{x^m_t∈R：∀t≥0, ∀m≥0\}$ ， $x_t^m$ 为 $t$ 时刻的第m个指标的真实数据， $u_t^m$ 表示时间 $t$ 的 $x_t^m$ 的计算值， $y_t^m$ 为第m个指标的输出结果， $y_t$ 为整体预测结果。

$x_t^m$ 通过计算器得到计算值 $u_t^m$ ，然后 $x_t^m$ 和 $u_t^m$ 分别作为比较器的输入，得到第m个指标的输出 $y_t^m$ 。 $y_t^1$ , $y_t^2$ … $y_t^m$ 作为决策器的输入得到 $y_t$ 。 $y_t$ 是一个二元值，可以用TRUE（表示输出数据正常），FALSE（表示输入数据异常）表示。下面对计算器和检测器进行说明。