1、paper:https://arxiv.org/pdf/2104.09044.pdf
2、code:https://github.com/dvlab-research/ReviewKD
思谋科技出品的paper,d2的源码,是不是考虑白嫖一波,先分析一下,本文直接描述paper的核心思想,实在不想按照paper的格式逐字翻译,直接贴核心思想就行了:
1、abstract
papr指出以前的工作teacher和student的模型逐层映射学习,也就是说对应层互相学习,如下图c所示,但是,本文发现,如下图d所示,能够更好地学习,因此paper在图d的基础上, 更进一步的按照公式推导设计出新的模型结构用来将teahcer和student的featuremap进行映射到新的特征空间和学习,发现有效果,我已经将paper的源code移植到我自己的工作里面去了,目前来看,可能是我的模型太小了,与teacher的相应的guided层不对,效果还是