时间序列异常检测
文章平均质量分 61
异常检测
西西弗的小蚂蚁
不要辜负这美好的时光!
展开
-
MTS-Mixers: Multivariate Time Series Forecasting via Factorized Temporal and Channel Mixing
为了公平地比较预测性能,我们遵循相同的评估协议,其中ILI的历史视界长度设置为36,其他为96。ILI的预测长度为{24,36,48,60},其他的预测长度为{96,192,336,720}。为了公平比较,我们遵循相同的标准协议,将所有预测数据集按ETT数据集6:2:2和其他数据集7:1:2的比例分成训练集、验证集和测试集。记录了2002-2021年美国疾病控制与预防中心每周流感样疾病(ILI)患者数据,描述了观察到的ILI患者比例和患者总数。为了公平的比较,所有的基线都遵循相同的评估协议。原创 2023-08-02 16:34:09 · 27 阅读 · 0 评论 -
ST4ML: Machine Learning Oriented Spatio-Temporal Data Processing at Scale
Spatio。原创 2023-08-01 16:26:28 · 11 阅读 · 0 评论 -
Neuro-symbolic Models for Interpretable Time Series Classification using Temporal Logic Description
本文提出神经符号时间序列分类(NSTSC),一种神经符号模型,利用信号时序逻辑(STL)和神经网络(NN)来完成多视图数据表示的TSC任务,并将模型表示为人类可读、可解释的公式。然而,以往的工作仅显式地对时间序列与类别之间的关系进行建模,忽略了关系的多样性,信息利用不足。在包含111,888个多结果手术的大数据集和外部高分辨率ICU数据集上的实验表明,所提出模型可以实现强大的预测性能(即高准确性),并为基于术中时间序列的预测结果提供鲁棒的解释(即高透明度)。主要的术后并发症对手术患者是毁灭性的。原创 2023-02-22 20:21:36 · 7 阅读 · 0 评论 -
First De-Trend then Attend:Rethinking Attention for Time-Series Forecasting
基于这些性能差异分析,本文提出了TDformer,该模型在季节趋势分解后,分别使用MLP和傅里叶注意力模型对趋势和季节性进行建模。:TDformer(趋势分解Transformer),首先应用季节趋势分解,然后将预测趋势分量的MLP与预测季节分量的傅里叶注意力相加组合,以获得最终预测。在基准时间序列预测数据集上的广泛实验表明,TDformer与现有的基于注意力的模型相比取得了最先进的性能。在理论上,不同领域的注意力模型在线性条件下是等效的(即注意力分数的线性核)。原创 2023-02-21 22:05:42 · 86 阅读 · 0 评论 -
Learning to Reconstruct Missing Data from Spatiotemporal Graphs with Sparse Observations
Learning to Reconstruct Missing Data from Spatiotemporal Graphs with Sparse Observations 在一个(可能是动态的)图上将多元时间序列建模为时间信号是一个有效的表示框架,允许开发时间序列分析模型。事实上,自回归图神经网络可以处理离散的图序列,以递归地学习每个离散时间和空间点的表示。时空图通常是高度稀疏的,其中时间序列具有多并发长序列的缺失数据的特征,例如由于底层传感器网络的不可靠导致的缺失数据。在这种情况下,自回归模型原创 2022-12-03 14:25:23 · 18 阅读 · 0 评论 -
Separation or Not: On Handing Out-of-Order Time-Series Data in Leveled LSM-Tree
在合成数据集和真实数据集上的实验表明,该模型在不同的延迟分布下均具有较高的WA估计精度。此外,基于估计模型,在开源的Apache IoTDB中实现了一个analyzer模块,用于选择低WA的策略。然而,给定特定的内存预算来缓冲数据,level LSM-Tree的写放大(WA)会受到πs的影响。分离的影响是正的还是负的,以及影响WA的程度取决于工作负载的属性以及有序和乱序memtable的容量。根据传统的策略(用πc表示),在写入数据时,首先将数据缓存在内存的MemTable中。原创 2022-11-01 19:53:43 · 5 阅读 · 0 评论 -
Mining Approximate Top-K Subspace Anomalies in Multi-Dimensional Time-Series Data∗
在这样的分析中,关键的数值指标,如利润和销售,会随着时间波动并形成时间序列数据。此外,时间序列数据对应的细分市场由一组属性描述,如年龄、性别、教育程度、收入水平和产品类别,这些属性形成多维结构。时间序列数据立方体中的异常检测带来了计算上的挑战,特别是在高维大数据集上。为此,提出一种高效的搜索算法,在原始高维空间中迭代地选择子空间,并检测每个子空间中的异常。在合成数据和真实数据上的实验验证了所提方法的有效性和高效性。这导致了对预期时间序列和异常度量的计算,异常度量衡量预期时间序列和观测时间序列之间的差异。原创 2022-10-27 20:28:18 · 6 阅读 · 0 评论 -
Fast Similarity Search in the Presence of Noise, Scaling, andTranslation in Time-Series Databases
该匹配系统由三个主要部分组成:(i)“原子”子序列匹配,(ii)长序列匹配和(iii)序列匹配。其基本思想是使用较小的原子子序列创建一个快速的、可索引的数据结构,该子序列表示所有序列的幅度缩放和偏移。第三阶段对第二阶段匹配到的子序列进行线性排序,以确定两个序列中是否存在足够的相似片段。如果两个子序列中的一个可以被包含在另一个周围的指定宽度的包络内,则认为它们是相似的。相似性序列模型,捕捉到的直观序列应该被认为足够相似的非重叠序列。该模型还允许在匹配的子序列中存在非匹配的空白。原创 2022-10-27 16:08:22 · 6 阅读 · 0 评论 -
Deep Extreme Mixture Model for Time Series Forecasting
开发了一种新的用于单变量时间序列预测的深度极端混合模型(DXtreMM),解决了时间序列中的极端事件。该模型由两个模块组成:1)基于变分解耦自编码器(VD-AE)的分类器和2)基于多层感知器(MLP)的预测单元,结合广义帕累托分布(GPD)估计器分别对下极值和上极值进行预测。通过在真实数据集上的大量实验表明,该模型在极端事件上表现良好,在正常时间步预测方面与现有的基线方法相当。我们的方法背后的思想是,大部分时间序列值遵循高斯分布,而位于分布尾部任意一部分的极值遵循重尾分布。我们开发了3种独立的预测模型,原创 2022-10-23 11:20:48 · 9 阅读 · 0 评论 -
Practical Approach to Asynchronous Multivariate Time Series Anomaly Detection and Localization(KDD)
这种方法背后的直觉是,在高度同步的信号中,一个小子集包含足够的信息,可以在正常操作期间重建集合的完整维度。许多特征以几乎一致的频率振荡。如果存在,频率作为先验,可以在单独的层中利用,该层学习多元输入的同步表示。𝑊向量包含理论上占主导地位的频率,通常出现在序列特征中,其中𝑆是足以近似多元时间序列𝑌的正弦成分的数量。然而,信号规模的增长,无论是在体积还是维度上,都超过了传统的统计状态空间或监督学习工具。然而,在实现这些方法时,我们遇到了缺陷,例如需要部分监督和高维数据集的弱点,以及本文讨论的其他原因。...原创 2022-08-14 12:14:03 · 817 阅读 · 0 评论 -
A Model-Agnostic Approach for Learning with Noisy Labels of Arbitrary Distributions
然而,现有方法具有一些先决条件,在许多应用中可能不实用(例如,它们与特定的下游模型架构相关联,或适用于特定的噪声分布)。图1显示了其中两个在现实中更可能发生的情况。我们首先研究了更简单的情况,标签错误的概率只取决于类别,在这种情况下,标签噪声可以简单地通过转移矩阵建模。我们可以观察到,紫色的点作为噪声数据位于橙色区域的边界附近(图1(c1))或集中在内部特定区域(图1(c-2)),每个样本都有自己的噪声过渡向量。在具有真实世界噪声和注入标签噪声的多个数据集上的实验表明,所提出方法的性能优于最先进的方法。..原创 2022-08-10 16:26:59 · 267 阅读 · 0 评论 -
USAD : UnSupervised Anomaly Detection on Multivariate Time Series
IT系统的自动监管是Orange目前面临的一个挑战。考虑到其IT业务的规模和复杂性,随着时间的推移,用于推断正常和异常行为所需的传感器数量急剧增加,使得传统的基于专家经验的监管方法变得缓慢或容易出错。本文提出了一种基于逆训练自编码器的多元时间序列无监督异常检测(USAD)方法。它的自动编码器架构使它能够以一种无监督的方式学习。对抗性训练的使用及其架构使其能够隔离异常,同时提供快速训练。我们通过在5个公共数据集上的实验研究了我们的方法的性质,从而证明了它的鲁棒性、训练速度和较高的异常检测性能。通过使用Oran原创 2022-06-07 00:00:23 · 1514 阅读 · 1 评论