python时间序列异常值查找_(No.38)时间序列异常点检测算法

写在前面:

针对一个数值序列,识别出其中的异常波动点。例如:

p = [1 1 1.1 1 0.9 1 1 1.1 1 0.9 1 1.1 1 1 0.9 1 1 1.1 1 1 1 1 1.1 0.9 1 1.1 1 1 0.9 1, ...

1.1 1 1 1.1 1 0.8 0.9 1 1.2 0.9 1 1 1.1 1.2 1 1.5 1 3 2 5 3 2 1 1 1 0.9 1 1 3, ...

2.6 4 3 3.2 2 1 1 0.8 4 4 2 2.5 1 1 1];

其实不同场景有不同的使用需求,有的场景需要识别peak点,有的场景需要识别异常波动的起始点。

下面介绍一种方法对不同场景下都有一定启发意义,可以在该基础上做一定的trick。

Smoothed z-score algorithm

主要思想:

1 利用过去一段历史窗口针对下个节点值做预测(利用平均值,方差信息),若是其超过了一定的阈值,则是个异常点。

2 对异常点的数值进行平滑,以便评估下下个点是否为异常点。因为不做平滑,由于当前是个异常点,对平均值、方差影响较大,若是下一个点仍是异常点,可能不会识别。

可以看到红色是序列数据,灰色区域是可接受的范围值,中间的绿线是平滑后的预估值。

当红色点超出灰色区域,则在下面标记一个信号量,其取值为-1,0,1.

这样就把一个序列数据,转变成一个类似脉冲信号的中间态。然后我们就可以基于这个信号根据需求加以利用。

python代码:

可见,根据当前值和历史平均值的绝对差值和方差做比较。

然后对当前节点做平滑,平滑系数是(0,1),值越大越受当前值的影响。

参考参数:lag=5左右, threshold=3.5左右, influence=0.5左右

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值