知识蒸馏

最新推荐文章于 2024-05-26 05:51:22 发布

ZZJune

最新推荐文章于 2024-05-26 05:51:22 发布

阅读量350

点赞数 2

分类专栏：图像处理深度学习文章标签：知识蒸馏模型压缩

本文链接：https://blog.csdn.net/qq_31293215/article/details/103296113

版权

图像处理同时被 2 个专栏收录

9 篇文章 0 订阅

订阅专栏

深度学习

1 篇文章 0 订阅

订阅专栏

在这里插入图片描述用大模型来教小模型
神经网络训练可以看做是学习做题，常规训练是做完后对比答案，知识蒸馏的一个关键思想是软化目标，将中间结果作为监督信息，就好比老师不止教学生最终答案，还告诉他其中一些步骤的结果。
在这里插入图片描述
软化目标最初表现为修改softmax层，将他的输出平滑化

在这里插入图片描述

一个典型的框架
下面举例了一些论文，多是以teacher网络的中间输出作为监督信息

在这里插入图片描述

在这里插入图片描述
论文2

在这里插入图片描述
论文3

在这里插入图片描述
论文4

论文5，iccv19，学生比老师效果还好

在这里插入图片描述

一个题外话论文，bag of tricks for 提点

参考文献：
https://blog.csdn.net/zhongshaoyy/article/details/53582048
https://mp.weixin.qq.com/s?__biz=MzI0ODcxODk5OA==&mid=2247506755&idx=2&sn=d958c2a5899cb92abac806bb9ff4f1c4&scene=21#wechat_redirect
https://zhuanlan.zhihu.com/p/51563760
https://www.microsoft.com/en-us/research/wp-content/uploads/2016/02/tr-2007-40.pdf
https://zhuanlan.zhihu.com/p/53864403
https://www.cnblogs.com/SuperLab/p/10750486.html
https://zhuanlan.zhihu.com/p/53864403

ZZJune

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
知识蒸馏

神经网络训练可以看做是学习做题，常规训练是做完后对比答案，知识蒸馏的一个关键思想是软化目标，将中间结果作为监督信息，就好比老师不止教学生最终答案，还告诉他其中一些步骤的结果。软化目标最初表现为修改softmax层，将他的输出平滑化下面举例了一些论文，多是以teacher网络的中间输出作为监督信息论文2论文3论文4论文5，iccv19，学生比老师效果还好...
复制链接

扫一扫