【论文笔记】【CVPR2022】【异常检测】Self-Supervised Predictive Convolutional Attentive Block for Anomaly Detection

Merengue_l

已于 2022-03-14 16:17:35 修改

阅读量8.8k

点赞数 13

分类专栏：计算机视觉深度学习异常检测文章标签：计算机视觉深度学习人工智能

于 2022-03-09 20:06:17 首次发布

本文链接：https://blog.csdn.net/weixin_44866655/article/details/123385677

版权

计算机视觉同时被 3 个专栏收录

9 篇文章 5 订阅

订阅专栏

深度学习

9 篇文章 1 订阅

订阅专栏

异常检测

3 篇文章 2 订阅

订阅专栏

[CVPR2022] (SSPCAB)Self-Supervised Predictive Convolutional Attentive Block for Anomaly Detection

CVPR 2022
Link: [2111.09099] Self-Supervised Predictive Convolutional Attentive Block for Anomaly Detection (arxiv.org)
Code: ristea/sspcab (github.com)

1. Intro

在这里插入图片描述

提出了**self-supervised predictive convolutional attentive block (SSPCAB)，**使用masked 卷积核和channel注意力机制，执行一个重构masked信息的自监督任务用于训练，原始特征经过该block达到增强特征的效果（让特征在正常和异常图上的差异变大，因为只在正常图像上训练）

SSPCAB可以整合到任何CNN架构的任何层中（⭐）

在当前video和image AD的SOTA模型中加入SSPCAB可以提高检测效果。

2. Method

SSPCAB = masked conv layer + Squeeze-and-Excitation (SE) module

Motivation:

现有的CNN框架能提取到一个层次化的特征，从low-level（边、角）到high-level（语义特征，如车轮、鸟头等），但是缺乏一种把这些局部特征整合起来的能力。因此提出SSPCAB进行一个reconstruction自监督学习任务来学习这些局部特征的global structure。使用了dilated masked convolution kernel 和 channel attention module

2.1 Masked convolution

请添加图片描述

一个kernel包含四个sub-kernel，只有这四个sub-kernel参与运算。

每个sub-kernel的大小为 $k ’$

dilation rate 为 $d$

感受野的中心为 $M$ ，大小为1

所以，整个kernel大小为 $k = 2 k ’ + 2 d + 1$

四个sub-kernal的输出做sum作为M位置（mask）的输出，输出是一个单值
（zero-padding = $k ’ + d$ ，stride = $1$ ）

因为通道数为 $c$ ，所以需要 $c$ 个大kernel

输入（ $X$ ）和输出（ $Z$ ）的维度不变。

2.2 Channel attention module

在这里插入图片描述

对于Masked convolution的输出，想要探究通道之间的关系，施加注意力在更重要的通道上，使用了 Hu $et\ al$ 提出的SE（Squeeze-and-Excitation）module，一种在channel维自适应重新校准的机制（channel attnetion）。

Attention module

先对feature map（ $z$ ）先进行GAP（Globle Average Pooling）： $h * w * c \to 1 * 1 * c$

再经过两个FC，第一个加ReLU，第二个加sigmoid，先降维再升维度（ $c \to c / r \to c$ ）得到一组channel attention权重。

再将该权重加载原始feature map的各个通道上输出（ $s$ ），保持输入输出维度不变。
在这里插入图片描述

在这里插入图片描述

2.3 Reconstruction loss

使用自监督学习方法重构masked区域来训练block

重构结果和目标计算MSE作为loss

在这里插入图片描述

总loss为模型原始loss $L_F$ 加 $L_{SSPCAB}$

在这里插入图片描述

3. Experiment

3.1 在Avenue数据集上调参

后续实验选择： $k ’ = 1$ ， $d = 1$ ， MSE Loss，Attention module中 $r = 8$ ，使用channel attention module

在这里插入图片描述

3.2 Image AD

dataset：MVTec-AD

在DRAEM和CutPaste上加入SSPCAB进行实验，结果有所提高。

但不是SOTA。

在这里插入图片描述

3.3 Video AD

dataset：Avenue & ShanghaiTech

SOTA

在这里插入图片描述

3.4 Inference Time

在这里插入图片描述

4 Ablation

4.1 将SSPCAB放在网络的不同置

结论：放在后面好一点

在这里插入图片描述

4.2 使用不同大小的mask M

结论：没啥区别

在这里插入图片描述

5 Limitation

将SSPCAB放在靠近输入的位置没啥效果

Merengue_l

关注

13
点赞
踩
38

收藏

觉得还不错? 一键收藏
2
评论
【论文笔记】【CVPR2022】【异常检测】Self-Supervised Predictive Convolutional Attentive Block for Anomaly Detection

CVPR 2022 异常检测论文
复制链接

扫一扫