曲线分类-特征提取(一)

通过对曲线进行数据去噪、标准化、统计特征提取,如3-σ去噪、移动中位数去噪、max-min标准化、z-score标准化、偏度和峰度计算,提升智能告警的准确度。数据描述涉及每分钟点的监测数据,去噪方法包括3-σ和移动中位数,数据标准化用于消除数值大小影响,统计特征关注中心位置、发散程度和波动率,为曲线分类提供依据。
摘要由CSDN通过智能技术生成

一种异常检测算法很难满足所有的业务类型曲线。若想提高智能告警的准确度,有必要对不同 曲线进行分类,以便于针对不同曲线,应用不同的异常检测算法。那么一条曲线,到底包含了哪些信息,可以帮助我们进行特征提取呢?

数据描述

数据每分钟一个点,一天1440个数据点,每天为一个周期,共7天数据。
测试数据为monitor数据,视图4180,属性231960.
原始数据

数据去噪

常用的去噪方法有:3-σ去噪、移动中位数去噪。

3-σ去噪

数据点与均值相差超过3个标准差,则认为为噪点
噪点数据

移动中位数去噪

用中位数代替均值,用中位数偏差代替标准差,避免极端异常值的影响。通过移动分段中位数,增强局部异常点的探测。

import numpy as np
import pandas as pd
def median_noise_filter(df_data, threshold=15,rolling_median_window=50):
    exceptions = pd.Series()
    df_data['median'] = df_data['value'].rolling(window=rolling_median_window, center=True).median().fillna(method='bfill').fillna(
        method='ffill')
    difference = np.abs(df_data['value'] - df_data['median'])
    median_difference = np.median(difference)
    if median_difference != 0:
        s = difference / float(median_difference)
        exceptions = s[s > threshold]
    return exceptions

移动中位数去噪

移动中位数去噪需要选择合适的滑动窗口和偏差阈值参数。3-σ简单直接,但会受到极端值的影响

噪点填充

噪点填充为前一个和后一个正常点的均值

数据标准化(归一化)

将数据按比例缩放,去除数据的单位限制,将其转化为无量纲的纯数值,专注于曲线的形状识别,而不关心曲线上点数值的大小。

max-min标准化

对原始数据的一种线性变换,使原始数据映射到[0-1]之间,指将原始数据的最大值映射成1,是最大值归一化

x=xminmaxmin x ∗ = x − m i n m a x − m i n

max-min归一化

z-score标准化

根据原始数据的均值和标准差进行标准化,经过处理后的数据符合标准正态分布,即均值为0,标准差为1.本质上是指将原始数据的标准差映射成1,是标准差归一化。曲线数值表示该点与均值相差的标准差的数据量:

x=xμσ x ∗ = x − μ σ

曲线值反映了数据点与均值相差的标准差个数。
z-score归一化

统计特征

中心位置

借由中心位置,可以知道数据的一个平均情况。数据的中心位置可分为均值(Mean),中位数(Median),众数(Mode)

  • 均值:表示统计数据的一般水平。受到极端值影响
  • 中位数:在 n 个数据由大到小排序后,位在中间的数字,不受极端值影响
  • 众数:一组数据中出现次数最多的数据值,不受极端值影响、非数值性数据同样适用

发散程度

数据的发散程度可用极差或全距(R)、方差(Var)、标准差(STD)、变异系数(CV)来衡量.

R=xmaxxmin
  • 10
    点赞
  • 113
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值