【论文笔记】Student-Teacher Feature Pyramid Matching for Anomaly Detection

HarryXxc

已于 2022-03-10 18:29:25 修改

阅读量2.8k

点赞数 4

分类专栏：论文笔记文章标签：深度学习计算机视觉人工智能异常检测无监督学习

于 2022-02-23 20:39:33 首次发布

本文链接：https://blog.csdn.net/harryshumxu/article/details/123097786

版权

论文笔记专栏收录该内容

3 篇文章

订阅专栏

本文介绍了一种使用知识蒸馏方法在MVTecAD数据集上进行异常检测的技术，通过ResNet-18预训练的teacher网络指导随机初始化的student网络学习，利用teacher-student特征匹配判别正常与异常样本，通过embedding差异检测异常情况。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

原文地址：https://arxiv.org/pdf/2103.04257.pdf
代码可以参考：https://paperswithcode.com/paper/student-teacher-feature-pyramid-matching-for

核心：利用知识蒸馏的方式在MVTec AD数据集上进行异常检测

在这里插入图片描述

论文中的teacher网络是在ImageNet上预训练的ResNet-18
而student网络中的参数是随机初始化的
在训练过程中，使得student逼近teacher
论文利用两点来进行异常检测：
（1）因为teacher没有教student学习异常的能力，所以在测试异常样本时，teacher和student提取的特征（embedding）不同
（2）因为student的参数是随机初始化的，那么训练完成后，不同student之间学到的embedding不同

我也是第一次看知识蒸馏方面的论文，读了源码之后，我发现，在训练时，teacher网络是不动的，改变的是student网络。

我的理解是，这里因为teacher是在ImageNet上预训练过的，所以有一定的提取特征的能力，相对于student肯定是比较优越的，所以这里将teacher作为一个参照物。

可以这么理解：

在训练过程中，因为正常样本比较相似，我们可以假设训练的图片都一模一样。
那么一开始teacher和student提取的特征有差别，根据loss进行一次更新，student的能力得到了一点提升；然后进行第二次训练，因为又是一张一模一样的图片，那么teacher学到的东西和之前一样，那此时teacher又把同样的知识交给student，student的能力又得到了一点提升。
如此继续，student识别这张图片的能力就接近了teacher，最后student也能够识别正常样本了。
在测试时，如果丢进去异常样本，teacher因为是预训练过的，所以也是有一定的提取能力，（也可以理解为有一定的泛化能力），但是student没有学过这个样本，就可能提取出“四不像”，这样就可以比较student和teacher两者提取特征之间的embedding距离来判断异常了。

参考内容：