知识蒸馏论文读书笔记

最新推荐文章于 2024-05-15 11:21:13 发布

Uncle_Sugar

最新推荐文章于 2024-05-15 11:21:13 发布

阅读量378

点赞数 1

分类专栏：知识蒸馏文章标签：神经网络深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_29278271/article/details/104352292

版权

突然觉得，我应该做一点笔记，梳理一下学过的东西，否则年一过，整个人就跟失忆了一样。
知识蒸馏这个名字非常高大上（不得不说大佬不仅想法清新脱俗，名字也起的情形脱俗啊）。如果直白地说老师学生模型，那就不酷了。
下面是论文的总结梳理，

第一次尝试-Model Compression

在2015年hinton 的知识蒸馏文章发表出来之前，就有人尝试过让一个小模型去学习一个大模型的表现，以期能够达到与大模型等同的性能。
这篇文章的标题就叫“Model Comperssion”，是2006年的文章，大家都还在用CPU训练模型，不会有什么很大的神经网络是需要大家去压缩。这里的需要被压缩的“Model”是一个集成学习的模型。
作者在文中提到的压缩集成学习模型的目的与现在压缩神经网络的原因如出一辙。

集成模型往往体积大且运算缓慢，这使得集成学习算法在面对低内存，低空间（应该是硬盘），低运算能力，以及实时性要求高的场景下比较无力。

模型压缩的流程也比较类似。

用训练数据训练 $D_1$ 集成学习模型 $T$
用MUNGE算法生成无标签数据，将无标签数据作为 $T$ 的输入，得到相应的标签得到人工数据集 $D_2$
用人工数据集 $D_2$ 训练神经网络模型 $S_1$
用原始数据 $D_1$ 训练神经网络模型 $S_2$

最低0.47元/天解锁文章

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
知识蒸馏论文读书笔记

知识蒸馏的教育体制改革之路突然觉得，我应该做一点笔记，梳理一下学过的东西，否则年一过，整个人就跟失忆了一样。知识蒸馏这个名字非常高大上（不得不说大佬不仅想法清新脱俗，名字也起的情形脱俗啊）。如果直白地说老师学生模型，那就不酷了。是的，知识蒸馏本质上下面是论文的总结梳理，跨种族的学习-Model Compression就好像《三国演义》不会从魏蜀吴三国都建立之后开始写，在2015年hi...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。