Revisiting Time Series Outlier Detection: Definitions and Benchmarks

本文探讨了时间序列离群值检测的定义和基准测试方法,提出了行为驱动的分类法,细化了点离群值和模式离群值。研究发现,经典算法在合成和真实数据集上的表现往往优于深度学习方法。此外,文章提出了一个通用的综合标准,并生成了35个合成数据集,以帮助评估不同类型的异常值检测算法。
摘要由CSDN通过智能技术生成

本文是对《Revisiting Time Series Outlier Detection: Definitions and Benchmarks》文章的翻译。


摘要

时间序列离群点检测在过去十年中得到了广泛的研究,提出了许多先进的算法。尽管做出了这些努力,但很少有研究调查我们应该如何对现有算法进行基准测试。特别是,使用合成数据集进行评估已成为文献中的常见做法,因此,有一个通用的综合标准来对算法进行基准测试至关重要。这是一项非常重要的任务,因为现有的合成方法在不同的应用中非常不同,并且离群值定义通常是不明确的。为了弥补这一差距,我们提出了一种行为驱动的时间序列离群分类法,并将离群分类为具有明确上下文定义的点和模式离群。按照新的分类法,我们提出了一个通用的综合标准,并相应地生成了35个综合数据集。我们进一步确定了来自不同领域的4个多元现实世界数据集,并在合成数据集和现实世界数据集中对9个算法进行了基准测试。令人惊讶的是,我们观察到一些经典算法可以优于许多最近的深度学习方法。数据集、预处理和合成脚本以及算法实现在GitHub中可以看到。

1 引言

在这里插入图片描述
在这里插入图片描述
从时间序列数据中检测异常值在各个领域具有广泛的应用,如制造商、边缘设备和HVAC系统。已经提出了许多用于时间序列离群点检测的算法,包括基于预测的模型,如自回归和循环神经网络

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值