时间序列异常检测一直是一个重要的研究课题。如果有什么不同的话,这是一项在迅速发展的物联网时代变得越来越重要的任务。虽然文献中有数百种异常检测方法,但有一种定义,即时间序列不一致(time series discord),已经成为从业者的一个具有竞争力的流行选择。时间序列不一致是指时间序列的子序列与最近邻居的距离最大。也许discord最吸引人的特点是它们的简单。与许多带参数的方法不同,discord只需要用户设置一个参数:子序列长度。本文认为,对这一单一用户选择的敏感性降低了不和谐的效用。这个问题的明显解决方案,计算所有长度的不一致,然后选择最佳异常(在某种度量下),在计算上似乎是站不住脚的。本文提出MERLIN算法,可以高效、准确地在大量时间序列档案中找到所有长度的不协调。在大规模和多样化的实验中证明了所提出想法的实用性,并表明MERLIN可以发现违背现有算法甚至是仔细人工检查的微妙异常。展示了如何利用计算冗余使MERLIN比可比算法快两个数量级
MERLIN: Parameter-Free Discovery of Arbitrary Length Anomalies in Massive Time Series Archives
于 2022-11-12 16:15:06 首次发布