基于相关性分析的工业时序数据异常检测

最新推荐文章于 2024-05-09 13:05:27 发布

bhzyq07

最新推荐文章于 2024-05-09 13:05:27 发布

阅读量720

点赞数

文章标签：数据分析

本文链接：https://blog.csdn.net/bhzyq07/article/details/133656704

版权

基于相关性分析的工业时序数据异常检测

在这篇文章中，作者提出了一种基于序列相关性分析的多维时间序列异常检测方法。在这个方法中，首先会计算多维时间序列的相关性矩阵，然后根据相关性矩阵构建一个时序相关图模型。在这个模型中，每个顶点代表一个时间序列，每条边的权值表示两个时间序列之间的相关性。

然后，作者通过在时序相关图上的相关性强度来划分时间序列团。具体来说，如果检测到边的权值低于给定的相关性阈值θc，那么就认为异常存在于该边相连的两个点之中。

具体过程如下：

数据预处理:由于采集的原始工业时间序列数据里存在一些数据质量问题[4,5],因此在数据预处理部分,需要对原始的时间序列数据进行时标对齐、缺失值填充等准备性操作,将整理好的高质量数据输入到后面模块进行计算分析;

• 时序数据相关性计算:将准备好的时间序列数据按工作周期模式进行分段,得到若干个时间子序列组,对每个子序列组分别进行序列 PAA 处理(第 3.1 节)、计算相关性参数生成相关性矩阵(第 3.2 节),根据矩阵中的元素值建立时序相关性图,并根据相关性阈值划分图上的时序相关团,该部分具体算法及案例分析在第 3.3 节中介绍;

• 异常检测:在异常检测部分,我们利用已计算得到的时序相关性图模型对待检测数据中隐藏的异常数据进行检测识别.对于彼此存在相关性的序列集合,我们采用基于相关性参数计算异常检测的方法,对时序相关团内以及不同团之间分别进行异常数据挖掘与识别.对于与其他序列无明显相关的序列,我们进行单维序列异常检测.

数据预处理

PAA方法的主要步骤如下：

将原始时间序列分割成w个相等长度的段。
对每一段计算其均值。
用这些均值来代表原始时间序列。

在这里插入图片描述

import numpy as np

# 假设x是一个numpy数组，代表原始时间序列
x = np.array(...)

# w是我们想要的段数
w = ...

# 计算每一段的长度
segment_size = len(x) // w

# 对x进行分段，并计算每一段的均值
paa = np.array([np.mean(x[i:i+segment_size]) for i in range(0, len(x), segment_size)])