Learning Memory-guided Normality for Anomaly Detection 论文解析——模型介绍

最新推荐文章于 2023-12-05 20:58:29 发布

八座金球的小怪兽

最新推荐文章于 2023-12-05 20:58:29 发布

阅读量1.6k

点赞数 8

分类专栏：笔记文章标签：计算机视觉目标检测神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_51951959/article/details/121239321

版权

笔记专栏收录该内容

1 篇文章 0 订阅

订阅专栏

Learning Memory-guided Normality for Anomaly Detection论文模型介绍

本文为对 Learning Memory-guided Normality for Anomaly Detection一文所提出的创新模型的介绍。

在这里插入图片描述

如图所示，该模型为对传统卷积自编码器的优化，主要模块可分为三个部分：Encoder、Memory Module和Decoder。

Network architecture

Encoder and Decoder

本文在U-Net的基础上对Encoder和Decoder模块进行了修改。对于Encoder，由于ReLU函数会切断负值，限制不同特征的表达，因此我们移除了RELU层，并添加了一个L2归一化层，使得所有的特征都有一个共同的衡量尺度。

对于Decoder，由于U-Net中的残差连接( Skip connections)在处理重构任务时，可能无法从输入视频帧中提取到有用的特征，同时我们的模型可能会去学习使用输入的视频帧用于重构任务。因此，我们删除了重构任务时的残差连接，并保留了输入视频帧以用于预测未来的帧。

Encoder输入一个视频帧 I_t，将其转换为一个H×W×C（H代表高度，W代表宽度，C代表视频帧中的特征数量）的三维查询图q_t(query map)，同时我们定义q_t^k为特征图q_t中的每一项特征。然后将q_t输入到Memory模块中，完成后续对Memory中项目的读取和更新操作，从而记录典型的正常形态。Decoder输入查询和检索到的内存项，并重建视频帧I^{^}_t。

Memory Module

Memory包含M个用于记录各项数据的原型特征的项目，我们将每一项定义为p_m，而Memory的功能包括Read和Update两种。

Read

在Read操作中，对于每一个q_t，我们计算它与所有的p_m之间的余弦相似度，得到一个M × K的二维关系图，在垂直方向使用softmax函数，即用如下公式计算出匹配概率值：

在这里插入图片描述

对于每一个q_t^k，我们都要读取Memory的每一项p_m，同时赋予相应的权值ω_t，并计算出对应每一个q_t^k的加权平均特征p^{^}_t^k，计算公式如下：
在这里插入图片描述

注意：在这里我们使用Memory中的全部项目p_m，而不是选择相似度最高的项目来让我们的模型理解不同情况下的正常模式，以考虑整体正常特征。也就是说，我们用Memory中的项目p_m组合来表示每一个查询。

我们将读取操作符应用于单个查询，并获得转换后的特征p^{^}_t,将其沿着特征数量维度与q_t连接后，将他们输入到Decoder中，该操作使得解码器能够使用Memory项目的正常模式重构输入帧，降低CNN的学习描述成本，同时理解到正常的模式状态。

Update

对于Memory中的每一项，我们通过使用公式（1）中计算出的概率值，选择出声明该项为最近的项的全部查询。在这里需要注意的一点是：可以将多个查询分配给内存中的单个项。

我们用U_t^m表示Memory中对应查询q_t^k的索引集中的第m项，并使用U_t^m（集合索引）来更新Memory中的相应的项，更新方式如下：

在这里插入图片描述

对于上述更新公式，在这里做出几点解释：

f(·)为L2正则化
通过使用查询的加权平均值，而不是把所有的查询都加起来，我们可以更专注于在内存项目附近的查询q_t^k。

最后，我们使用类似公式（1）的方式计算出匹配概率值，与公式（1）不同的是，这次我们使用softmax函数计算的是水平方向的匹配概率值，即：

在这里插入图片描述

并参考查询索引U_t^m，对计算出的匹配概率值进行重构，即：

在这里插入图片描述

由于训练集和测试集的正常模式可能不同，并且他们可能随各种因素的改变而变化，我们在训练和测试时都会更新Memory中的项。举个最简单的例子：同一视频帧在光照和有遮挡的状态下，被检测出的正常模式可能是不同的。

因为正常帧和异常帧在测试的时候都是可用的，所以我们使用一个经过加权后的分数作为判断依据来避免Memory中的项目被异常的视频帧更新，这项分数仅在更新内存项时被使用，计算公式如下：

在这里插入图片描述

其中权值W_ij（i和j代表空间指数）的计算方式如下：

在这里插入图片描述

当我们用公式（6）计算出的分数高于阈值，我们便认为视频帧I_t是异常视频帧，不使用它更新Memory中的项。

Summary

上述模型为对传统卷积自编码器的优化升级，在卷积自编码器的原有基础上，引入了Memory模块，而Memory模块的主要功能分为Read和Update两项。

Read阶段主要实现对每一项查询q_t^k与全部Memory项p_m的匹配概率计算和加权平均特征p^{^}_t^k的求解，其求解出的结果将其沿着特征数量维度与q_t连接，并将他们输入到Decoder中。

Update阶段主要实现对Memory项的更新，其更新过程可保证Memory中的项目对正常状态的理解程度保持在较高的水平上。

通过对Memory模块的引入，该模型大大提高了传统卷积自编码器的特征提取精确度，解决了原有模型无法处理正常行为多样性的问题，同时降低了CNN的学习成本，达到了很好的应用效果。

相关引用

项目创新点介绍

以上内容仅做科学研究

八座金球的小怪兽

关注

8
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
Learning Memory-guided Normality for Anomaly Detection 论文解析——模型介绍

Learning Memory-guided Normality for Anomaly Detection模型介绍本文为对 Learning Memory-guided Normality for Anomaly Detection一文所提出的创新模型的介绍。如图所示，该模型为对传统卷积自编码器的优化，主要模块可分为三个部分：Encoder、Memory Module和Decoder。Network architectureEncoder and Decoder本文在U-Net的基础上对Enc
复制链接

扫一扫

专栏目录

八座金球的小怪兽 CSDN认证博客专家 CSDN认证企业博客

码龄4年

5: 原创

133万+: 周排名

223万+: 总排名

4337: 访问

: 等级

62: 积分

5: 粉丝

10: 获赞

3: 评论

31: 收藏

私信

关注

热门文章

分类专栏

笔记 1篇

最新评论

回头看SE注意力机制及其PyTorch实现
CÃlimos: 你好请问reduction=16是自己设置的吗？
回头看ResNet及其PyTorch实现
CSDN-Ada助手: 恭喜您写了第四篇博客，看到您对ResNet及其PyTorch实现的深入分析，让我受益匪浅。建议您在未来的创作中，可以尝试结合实际应用场景，分享一些实践经验，让读者更好地理解和应用所学知识。再次感谢您的分享，期待您更多的精彩文章。 CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
回头看AlexNet及其PyTorch实现
CSDN-Ada助手: 恭喜您写出了这篇关于AlexNet及其PyTorch实现的博客。您的文章内容详尽，很容易让读者了解AlexNet的历史和PyTorch的实现方式。希望您能够继续坚持创作，分享更多有价值的知识和经验。下一步建议您可以尝试写一篇关于深度学习在自然语言处理中的应用，这是一个非常热门的话题，相信会吸引更多读者。再次感谢您的分享。 CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。