图像缺陷检测常用预训练模型

<2023.05.08> 新增截止当前常见的异常检测模型所使用预训练模型表

随着深度学习的发展,提取更加丰富的特征成为大家实现更好性能的共识。但由于缺陷数据的稀缺性,图像缺陷检测领域在许多应用场景都缺少样本进行训练,模型对于图像特征的提取能力有限,因此使用预训练的模型进行特征提取成为缺陷检测模型训练时一个不错的选择。

当前算法所使用的预训练模型

截止2023.05.08,Paperswithcode 上面关于 Anomaly Detection on MVTec AD Detection AUROC 性能排行榜单上最靠前的几个方法也都使用了预训练模型。

模型VGG-19EffiNet-B5ResNet-18WideResNet-50WideResNet-101ResNext-50ResNext-101DenseNet-201CaiT-M48-distilledDeiT-base-distille
PNI----x-xx--
PatchCore---xx-xx--
MemSeg--x-------
FastFlow--xx(-2)----xx
N-pad--xx-xx---
CFAxxxx(-2)------

以下介绍几种常用的预训练模型。

VGG

VGG1 网络于2014年提出,其对于神经网络的深度进行了探究,加深了网络层数,取得了当年的 ILSVRC 图像分类比赛的第一名。截止如今的2023年,VGG网络仍然是许多工作的首选。

在这里插入图片描述

Fig.1 VGG-16 模型

ResNet

随着 VGG 的提出,”越深的模型性能越好“也成了研究者以及从业者的共识。但是越深的网络越难以训练,模型经常会出现梯度消失问题。为了解决该问题,He 等人提出了 ResNet 模型2。ResNet 使用了 Fig.2 所示的残差连接模块,使得模型学习的是结果与x之间的残差,缓解了梯度下降等问题,进一步加深了模型层数。如今 ResNet 模型也依旧得到广泛使用,其残差思想在如今的 transformer 结构中也经常出现。

在这里插入图片描述

Fig.2 残差连接模块

HRNet

HRNet3,全称 High-Resolution Net,旨在保留特征高分辨率的表征能力。对于上诉我们介绍的 VGG 以及 ResNet 模型其模型计算所得的特征图随着层数的增加,尺寸越小,这对于需要捕捉全局特征的图像分类任务是没什么问题的,但对于分割、目标识别等需要精细定位的任务而言,高分辨率的语义表征是十分重要的。

HRNet 使用了多分支多分辨率的子网络进行推理,并对不同分辨率的特征图进行融合保留图像的高分辨率表征。在当时的人体姿态检测以及coco数据集上的关键点检测任务取得了SOTA。

在这里插入图片描述

Fig.3 HRNet 网络结构

WRNS

WRNS4,全称 Wide Residual Networks,使用了一种”更宽“的神经网络,在较浅深度的情况下有效得提高了模型的性能。此处的更宽指的是模型提取的特征维度,即特征通道数。该工作证明了增加模型的宽度是对模型的性能是有提升的。

参考 Reference


  1. Very Deep Convolutional Networks for Large-Scale Visual Recognition ↩︎

  2. Deep Residual Learning for Image Recognition ↩︎

  3. Deep High-Resolution Representation Learning for Visual Recognition ↩︎

  4. Wide Residual Networks ↩︎

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值