DCdetector

Jacob_yf

已于 2023-08-26 15:46:56 修改

阅读量735

点赞数 1

分类专栏：时间序列文章标签：论文阅读

于 2023-08-24 23:07:30 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_65130206/article/details/132484224

版权

时间序列专栏收录该内容

1 篇文章 0 订阅

订阅专栏

DCdetector: Dual Attention Contrastive Representation Learning for Time Series Anomaly Detection

作者：Yiyuan Yang, Chaoli Zhang, Tian Zhou

发表年份：KDD 2023

1. Introduction and Conclusion

这篇文章的归纳偏置和Anomaly Transformer相似。

异常点和整个序列关联少（少见），和临近的点关联相对多；而正常点可能共享一些潜在的模式，与其他点的关联相对强。

Anomaly Transformer通过可学习高斯核和注意力权重分布的关联差异（差异小，注意力集中在局部，更可能是异常）来检测异常。对比于Anomaly Transformer，这篇文章通过对比学习的方法实现了类似的目标。

1.1 Problems

常见的异常检测的挑战，a. It takes work to get tables. b. 需要考虑时间依赖，多维度间依赖和非统计特征。c. 异常少见

基于重构的方法，在不受异常阻碍的情况下学习正常数据的良好重构模型具有挑战性。换言之，学习一个干净的，可以很好重构正常点的模型很困难

1.2 Contributions

提出了基于双重注意力的对比学习结构（dual-branch attention)【通道独立，多尺度】

训练只需要对比，而不需要重构误差（和Anomaly Transformer比较）

2. Method

2.1 通道独立->patching

2.2 patch-wise attention，patch-in attention。（+上采样+多尺度）

2.2.1

patch-wise，patch和patch之间（在P上embed，P x N x d -> N x d)；patch-in，patch内部（P x N x d -> P x d）。见上示意图。对于某个时刻的点来说，patch-wise就是去计算它与其他几个patch相同位置的attention，patch-in就是计算同一个patch内它与其他点的attention。

Wq和Wk参数共享权重。

2.2.2 上采样

2.2.3 多尺度是指patch的大小不同，最后每个不同patch size的相加。

可以将这两种表示视为排列的多视图表示。（e.g. aabbcc -> abcabc)

归纳偏置：正常点可以在排列下保持其表示，而异常点则不能。从这种对比学习中学习一种排列不变的表示。

2.3 损失函数（KL散度）

3. Experiments

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
5
评论
DCdetector

patch-wise，patch和patch之间（P x N x d -> N x d)；对于某个时刻的点来说，patch-wise就是去计算它与其他几个patch相同位置的attention，patch-in就是计算同一个patch内它与其他点的attention。Anomaly Transformer通过可学习高斯核和注意力权重分布的关联差异（差异小，注意力集中在局部，更可能是异常）来检测异常。基于重构的方法，在不受异常阻碍的情况下学习正常数据的良好重构模型具有挑战性。
复制链接

扫一扫

专栏目录

Jacob_yf CSDN认证博客专家 CSDN认证企业博客

码龄3年

9: 原创

104万+: 周排名

79万+: 总排名

1万+: 访问

: 等级

134: 积分

179: 粉丝

18: 获赞

6: 评论

60: 收藏

私信

关注

热门文章

分类专栏

时间序列 1篇
笔记 8篇

最新评论

DCdetector
Jacob_yf: 详细的我有点忘记了，建议可以关注下维度之间的变化，可能可以帮助你理解。比如patchwise中，他把每个patch看成一个单元，相当于嵌入成patch_num x d再进行attention。
DCdetector
科研IT民工: 您好，您的2.2.1中介绍的patch-wise和in-patch有些不太懂，与图片不太能对应的起来。如patch-wise中，计算的是patch之间相同位置的attention，图中patch大小为3，但是根据图片来看，patch-wise部分似乎是patch内部的注意力计算，因为本来是展开的大小为3的patch，到下一步后就变成了叠起来的向量了。这一部分有些疑惑，方便的话还请博主讲解一下这一部分的过程。
DCdetector
Jacob_yf: 一样吧？在原文3.3.1
DCdetector
想做你的大英雄: 您的损失函数与原文中的为什么不一样呢
DCdetector
CSDN-Ada助手: 恭喜您第9篇博客的发布！标题中的“论文阅读-DCdetector”听起来非常有趣。您持续创作的努力可嘉，以深入研究和分享学术论文为主题，为读者提供了宝贵的资源和观点。在下一步的创作中，或许您可以考虑加入一些个人见解或对论文的进一步解读，以便更好地引导读者对于该主题的理解。此外，您可以尝试与其他热门领域的论文进行对比，以拓宽读者的视野并促进更深入的学术探讨。谦虚地说，我相信您在这一领域中有着更多的见解和贡献，期待您未来更多精彩的创作！

最新文章

目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。