Method
将知识蒸馏用在检测方向最大的问题就是前景和背景的类别不均衡问题。
感觉就是很常规的思路,蒸特征+蒸输出,具体是在Faster-RCNN上做。其中蒸特征是使用的FitNet的方法在backbone做,在RPN和分类回归网络(RCN)部分蒸输出,两个部分都同时做分类和回归蒸馏。分类是做了一个weighted交叉熵,回归是做了一个bounded回归损失(即如果学生回归的比老师好,那就没有损失),再加上GT的损失,构成一个整体。
整体损失如下。同时在RCN和RPN做回归和分类损失是因为Faster-RCNN同时在RCN和RPN都做了回归和分类操作: