【论文笔记】【CVPR2022】【异常检测】 Anomaly Detection via Reverse Distillation from One-Class Embedding

Merengue_l

已于 2024-10-16 10:02:41 修改

阅读量1.3w

点赞数 12

分类专栏：计算机视觉深度学习异常检测文章标签：深度学习计算机视觉机器学习

于 2022-03-13 21:15:29 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44866655/article/details/123466316

版权

计算机视觉同时被 3 个专栏收录

9 篇文章

订阅专栏

9 篇文章

订阅专栏

3 篇文章

订阅专栏

本文介绍了一种新颖的异常检测框架，结合了知识蒸馏和Encoder-Decoder结构，名为逆向蒸馏。通过训练一个不可更新的教师编码器和一个学生解码器，利用一阶级瓶颈嵌入（OCBE）模块，有效地去除冗余信息。OCBE模块包括多尺度特征融合块和一阶级嵌入块，以降维并融合特征。实验结果显示，该方法在MVTec-AD数据集上实现了像素级和图像级的优秀异常检测性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

[CVPR2022] Anomaly Detection via Reverse Distillation from One-Class Embedding

CVPR 2022
Link: [2201.10703] Anomaly Detection via Reverse Distillation from One-Class Embedding (arxiv.org)
Code: https://github.com/Merenguelkl/Reverse_Disstilation

1. Intro

https://i-blog.csdnimg.cn/blog_migrate/807da91ba10de4c6c0b5b9c58f439fa3.jpeg

提出一个新颖的知识蒸馏框架：Teacher Encoder + Student Decoder，并使用逆向蒸馏（Reverse Distillation），引入一个可训练的 one-class bottleneck embedding (OCBE) 模块作为bottleneck，该模块可以保留用于还原正常样本特征的信息。OCBE包含了multi-scale feature fusion block (MFF)
和 one-class embedding block (OCE)。

两个优点

1、非相似结构。若teacher和student模型使用相同或相似的网络结构，那在异常样本上输出的差异性不够；

2、紧凑的Embedding。喂给student网络的特征是去除了冗余信息的。

Contribution

1、提出了简单有效的逆向蒸馏方式，解决了传统知识蒸馏框架中non-distinguishing filter问题。

2、提出的OCBE模块将特征从高维投影到低维，去除了冗余信息。

3、MVTec-AD SOTA结果

2. Method

https://i-blog.csdnimg.cn/blog_migrate/59d1099e7778dfe79c1a7b5447cfb543.jpeg

Overview

teacher E提取多尺度特征，训练student D从bottleneck embedding中还原这些特征，训练过程只在正常图像上进行。OCBE将多尺度特征聚合并降维到低维空间中供student D还原特征。

2.1 Reverse Distillation

将知识蒸馏和Encoder-Decoder框架融合，蒸馏过程为student Decoder通过bottleneck embedding先还原深层特征（high level），再浅层特征（low level）。

训练时Teacher Encoder不进行权重更新，只训练OCBE和Student Decoder。

Student Decoder使用和Teacher Encoder对称的网络架构，目的是让相对应位置的特征维度一致。

e.g. 当Teacher Encoder使用参数为kernel size = 1，stride = 2的卷积操作时时，Student Decoder 使用kernel size = 2，stride = 2的反卷积操作。

Loss

在每一组feature map上计算一张anomaly map，计算方法为在通道维上计算余弦相似度。得到的anomaly map尺寸与相应位置feature map尺寸一致。

loss函数为每张anomaly map的数值平均求累加：

2.2 One-Class Bottleneck Embedding (OCBE)

若直接使用Encoder最后一层特征（原始bottleneck），有两个缺点：

1、维度太高，包含大量冗余信息；

2、最后一层特征包含高级特征（语义等），难以直接送入Decoder进行还原低级特征

为了客服以上缺点，提出了可训练的One-Class Bottleneck Embedding（OCBE）来降维并融合多level的特征，包含MFF和OCE

MFF

用于融合多级别特征，为了使得特征维度相同，对高级特征应用一个或多个大小为33，步长为2的卷积操作，并接有BN和ReLU。特征维度相同后进行拼接（concat），然后经过一个11的卷积核来降低通道数。

OCE

使用一个ResBlock得到更加适合用于Decoder还原Encoder特征的Bottleneck Embedding

2.3 Anomaly Scoring

像素级别

在Inference阶段，输入一张测试图像会得到L张Anomaly Map，对它们进行双线性上采样到原始图像大小，并进行相加，最终得到像素级别Anomaly Map，使用高斯模糊进行平滑处理。

图像级别

取Anomaly Map的最大值作为图像级别异常分数。

3. Experiment

3.1 Defect Detection

数据集：MVTec-AD

图像级别

https://i-blog.csdnimg.cn/blog_migrate/5aaab7bb0690f43d1b9cbe1016b0a6e1.jpeg

像素级别

https://i-blog.csdnimg.cn/blog_migrate/746cc98832422b5e7dd1ce8a9cc8c839.png

异常分数分布

3.2 Semantic Anomaly Detection

数据集：CIFAR-10、MNIST、F-MNIST

https://i-blog.csdnimg.cn/blog_migrate/0e3cdd8b03e7ab3821a1a91f61e29dd8.jpeg

4. Ablation

4.1 with/without OCBE

https://i-blog.csdnimg.cn/blog_migrate/6c8bd43e60b866e0b011347e9675e5f5.jpeg

4.3 Multi-Scale Feature

https://i-blog.csdnimg.cn/blog_migrate/149630a55810d4dc1562e0003291604f.jpeg

4.2 Different Backbones

https://i-blog.csdnimg.cn/blog_migrate/f75d2104864aaed26d6482c83fa9d896.jpeg

博客等级

码龄6年

9
原创

53
点赞

256
收藏

37
粉丝

关注

私信

热门文章

分类专栏

最新评论

【论文笔记】【CVPR2022】【异常检测】Self-Supervised Predictive Convolutional Attentive Block for Anomaly Detection
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文笔记】【CVPR2022】【异常检测】 Anomaly Detection via Reverse Distillation from One-Class Embedding
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文笔记】【ViT】 An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文笔记】【CLIP】Learning Transferable Visual Models From Natural Language Supervision
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文笔记】【CVPR2022】【异常检测】 Anomaly Detection via Reverse Distillation from One-Class Embedding
好好摸鱼，天天向上: 代码训练时出现评估结果Pixel Auroc:0.972, Sample Auroc0.977, Pixel Aupro0.909。请问Sample Auroc0.977这个指标是用在异常检测的，而第一个和第三个指标是用在异常定位的吗？

最新文章

目录

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。