YOLO蒸馏原理篇之---MGD、CWD蒸馏

本文介绍了两种特征蒸馏方法——MGD(Masked Generation Distillation)和CWD(Channel-wise Distillation),用于提高学生模型的表征能力。MGD通过掩蔽学生特征并使其恢复教师特征,而CWD关注通道级别的知识转移,通过softmax标准化特征图并计算KL散度。这两种方法在图像分类、目标检测等密集预测任务中展现出优势。
摘要由CSDN通过智能技术生成

一、MGD蒸馏

论文地址:https://arxiv.org/abs/2205.01529
论文翻译:https://mp.weixin.qq.com/s/FSvo3ns2maTpiTTWsE91kQ

1.1 摘要
知识蒸馏已成功应用于各种任务。当前的蒸馏算法通常通过模仿教师的输出来提高学生的表现。本文表明,教师还可以通过指导学生的特征恢复来提高学生的表征能力。从这个角度来看,我们提出了掩蔽生成蒸馏(MGD):通过屏蔽学生特征的随机像素,并迫使它通过一个简单的块来生成教师的完整特征。
MGD是一种真正通用的基于特征的蒸馏方法,可用于各种任务,包括图像分类、目标检测、语义分割和实例分割。

1.2 论文要点
1)引入了一种新的基于特征的知识蒸馏方法,它使学生通过其掩码特征生成教师的特征,而不是直接模仿。
2)提出了一种新的基于特征的蒸馏方法——掩蔽生成蒸馏,它简单且易于使用,仅有两个超参数。
3)通过对不同数据集的大量实验来验证该方法在各种模型上的有效性。对于图像分类和密集预测任务,学生使用 MGD 取得了显着的改进。

1.3 主要内容
基于特征的蒸馏可以应用于分类和密集预测。对特征蒸馏的基本方法可以表述为:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ghx3110

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值