【AAAI 2021】多出口架构的知识蒸馏:Harmonized Dense Knowledge Distillation Training for Multi-Exit Architectures

本文提出了一种新的多出口架构训练方法——协调密集知识蒸馏(HDKD),用于解决多出口模型的优化问题。HDKD允许每个出口从所有后续出口学习,通过一种双层优化策略平衡多目标损失。实验结果表明,这种方法能有效提高多出口网络的性能。
摘要由CSDN通过智能技术生成

【AAAI 2021】多出口架构的知识蒸馏:Harmonized Dense Knowledge Distillation Training for Multi-Exit Architectures

论文地址:

https://ojs.aaai.org/index.php/AAAI/article/view/17225

主要问题:

Multi-Exit 架构在特征层的不同深度引入一系列中间分类器,通过对“容易”的样本在中间层退出来执行自适应计算,以加速推理过程

在这里插入图片描述
目前基于该架构的知识蒸馏方法研究较少,一方面,他们采用了一个朴素的加权损失和,损失权重是取平均的或手动调整的,导致多出口分类损失和蒸馏损失之间的权衡没有得到很好的考虑,因为联合优化中的不同目标可能是竞争甚至冲突的,从而影响多出口类化和知识蒸馏的联合学习;另一方面,现有的方法主要采用最后一个出口作为教师模型,并将知识转化为早期的出口,然而为了充分释放知识蒸馏的潜力,有必要自适应地学习每个出口的所有后期出口

主要思路:

这篇文章设计了一种新的多出口体系结构的协调密集知识蒸

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

BIT可达鸭

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值