【论文研读】【流模型】【缺陷检测】FastFlow: Unsupervised Anomaly Detection and Localization via 2D Normalizing Flows

最新推荐文章于 2024-06-23 09:33:26 发布

fe_风满楼

最新推荐文章于 2024-06-23 09:33:26 发布

阅读量6.4k

点赞数 4

分类专栏：缺陷检测论文研读文章标签：深度学习计算机视觉机器学习

本文链接：https://blog.csdn.net/qq_45700830/article/details/122690958

版权

3 篇文章 0 订阅

订阅专栏

2 篇文章 2 订阅

订阅专栏

FastFlow: Unsupervised Anomaly Detection and Localization via 2D Normalizing Flows

![[imgs/截屏2021-12-23 下午3.30.10.png]]

其他模型：
- 当前的异常检测模型不能有效的将图像特征映射到一个明确的分布
- 当前模型忽略了局部特征和全局特征间的关系
- 传统flow模型，需将2D特征压缩成1D，进行概率估计，损伤了内部的空间关系信息，限制的flow的能力
- 传统flow模型，使用sliding window method，需在大量patch逐个检测异常，复杂度高、推理速度受限
FastFlow模型：
- 训练阶段，学习将输入的特征映射到特定的分布
- 推理阶段，利用似然去识别异常
- 2D的flow维持了原特征的空间位置关系，提升了检测效率
- 端到端的推理整个图片，直接输出异常检测和定位结果，推理效率高

![[imgs/截屏2021-12-23 下午4.09.27.png]]

特征提取器
- CaiT、DeiT、ResNet18、Wide-ResNet50-2
- 使用vision transformer时，仅用1层
- 使用resnet时，直接用前三个block的最后一层（输出尺寸：64、32、16）
Normalizing Flow
- $\to Z$
- change of variable formula：
  - $p_X(x)=p_Z(z)|det(\frac{\partial z}{\partial x})|$
  - $p_X(x)=log p_Z(z)+log |\det (\frac{\partial z}{\partial x})|=log p_Z(f_\theta(x))+log |det(\frac{\partial f_\theta(x)}{\partial x})|$
- Flow:
  - $\overset{f_1}{\rightarrow}H_1 \overset{f_2}{\rightarrow}H_2 \overset{f_3}{\rightarrow}H_3 ... \overset{f_K}{\rightarrow}Z$
  - $\overset{f_1^{-1}}{\leftarrow}H_1 \overset{f_2^{-1}}{\leftarrow}H_2 \overset{f_3^{-1}}{\leftarrow}H_3 ... \overset{f_K^{-1}}{\leftarrow}Z$
  - $y_a,y_b=split(y)$
  - ${y_a}'=y_a$
  - ${y_b}'=s(y_a) \bigodot y_b + b(y_a)，其中s()和b()的计算是本文的创新点，2D$
  - ${y}'=concat({y_a}',{y_b}')$

数据集：
- MVTec
- BTAD
- CIFAR-10
评价指标：
- 图片集和像素级的 the area under the receiver operating characteristic curve (AUROC)
复杂度分析：
- 推理速度
- 额外推理时间（不包括backbone网络）
- 额外参数量（不包括backbone网络）
定量结果：
- MVTec：
  - 图片级AUC：99.4，像素级AUC：98.5，SOTA
BTAD：
- 像素级AUC：97.0，SOTA
CIFAR-10：
Ablation Study
- subnet使用的卷积核大小：
  - （1）交替使用 $\times 3$ 和 $\times 1$ 卷积核
  - （2）只使用 $\times 3$ 卷积核
  - backbone为CaiT、Wide-ResNet50-2时，方案（1）性能好
  - backbone为DeiT、ResNet18时，方案（2）性能好
定性结果
网络细节
- backbone: ImageNet预训练，frozen
- optim: Adam(learning_rate=1e-3. weight_decay=1e-5)
- 500 epoch
- batch_size: 32

关注

专栏目录