【论文笔记】Student-Teacher Feature Pyramid Matching for Anomaly Detection

原文地址:https://arxiv.org/pdf/2103.04257.pdf
代码可以参考:https://paperswithcode.com/paper/student-teacher-feature-pyramid-matching-for

核心:利用知识蒸馏的方式在MVTec AD数据集上进行异常检测

在这里插入图片描述

  1. 论文中的teacher网络是在ImageNet上预训练的ResNet-18
  2. 而student网络中的参数是随机初始化的
  3. 在训练过程中,使得student逼近teacher
    论文利用两点来进行异常检测:
    (1)因为teacher没有教student学习异常的能力,所以在测试异常样本时,teacher和student提取的特征(embedding)不同
    (2)因为student的参数是随机初始化的,那么训练完成后,不同student之间学到的embedding不同

我也是第一次看知识蒸馏方面的论文,读了源码之后,我发现,在训练时,teacher网络是不动的,改变的是student网络。

我的理解是,这里因为teacher是在ImageNet上预训练过的,所以有一定的提取特征的能力,相对于student肯定是比较优越的,所以这里将teacher作为一个参照物

可以这么理解:

在训练过程中,因为正常样本比较相似,我们可以假设训练的图片都一模一样
那么一开始teacher和student提取的特征有差别,根据loss进行一次更新,student的能力得到了一点提升;然后进行第二次训练,因为又是一张一模一样的图片,那么teacher学到的东西和之前一样,那此时teacher又把同样的知识交给student,student的能力又得到了一点提升。
如此继续,student识别这张图片的能力就接近了teacher,最后student也能够识别正常样本了。
在测试时,如果丢进去异常样本,teacher因为是预训练过的,所以也是有一定的提取能力,(也可以理解为有一定的泛化能力),但是student没有学过这个样本,就可能提取出“四不像”,这样就可以比较student和teacher两者提取特征之间的embedding距离来判断异常了。


参考内容:

  1. https://mp.weixin.qq.com/s/snezeHSNwUsGPFmnXJ5QpA
  2. https://zhuanlan.zhihu.com/p/364914260
  • 3
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值