联邦学习

最新推荐文章于 2024-02-29 18:52:42 发布

Glory Man-United

最新推荐文章于 2024-02-29 18:52:42 发布

阅读量297

点赞数

文章标签：深度学习人工智能神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/geweicsdn/article/details/131365667

版权

知识蒸馏是一种模型压缩技术，通过教师神经网络指导学生神经网络学习。教师网络先在数据集上训练，然后其输出（包括Logits、特征和结构关系）被用来指导学生网络的训练，从而在保持小模型规模的同时，迁移学习到的知识。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

目录

知识蒸馏的分类

知识蒸馏

版权声明：本文为CSDN博主「_Old_Summer」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/Talantfuck/article/details/124545869

知识蒸馏也是一种模型压缩方法，知识蒸馏通过蒸馏的手段保护原模型中学习到的知识，然后将这些知识迁移到压缩模型中，使压缩模型虽然相比原模型体积要小的多，但是也可以学习到相同的知识。

知识蒸馏指的是模型压缩的思想，通过使用一个较大的已经训练好的网络去教导一个较小的网络确切地去做什么。

在知识蒸馏中称要进行压缩的模型为教师神经网络（Teacher Model），压缩之后的模型为学生神经网络(Student Model)，一般情况下，教师神经网络的体积要远大于学生神经网络。

一般的知识蒸馏过程为

1. 首先利用数据集训练教师神经网络，让教师神经网络充分学习数据中包含的知识

2. 然后在利用数据集训练学生神经网络时，通过蒸馏方法将教师神经网络中已经学习到的知识提取出来，指导学生神经网络的训练，这样学生神经网络相当于从教师神经网络那里获取到了关于数据集的先验信息。

也就是在知识蒸馏中，教师神经网络是预先在数据集上进行过训练的，然后在学生神经网络的训练过程中利用自身学习到的知识对其进行指导，帮助提高学生神经网络的准确率。

使用知识蒸馏要解决的关键问题是

1. 如何发掘教师神经网络中包含的知识

2. 如何将教师神经网络中的知识通过蒸馏无损的迁移到学生神经网络中，也就是蒸馏方法的设计

3. 如何设计学生神经网络的结构

知识蒸馏的分类

3.1 模型结构的种类
深度学习中虽然模型众多，但是其结构可以归为四种

前馈神经网络：也叫多层感知机，MLP，前馈神经网络由线性变换+非线性激活组成，通过线性变换将输入空间中的数据变换到特征空间，利用非线性激活函数无限逼近真实的判别函数。

卷积神经网络：CNN,卷积神经网络是连接受限的前馈神经网络，适合处理具有局部相关性的数据，比如图像

循环神经网络：RNN,循环神经网络会携带网络处理过程中产生的历史信息进行接下来的处理，适合处理那些具有时序性特征的数据

Transformer:带有注意力机制的前馈神经网络，利用注意力机制获取数据中的关键信息，可以利用有限的计算资源处理更重要的信息。

综上，多种网络结构其实可以统一看成前馈神经网络。

在知识蒸馏中，将教师神经网络中的知识分为三种

1. 输出层知识：图中的Response-based Knowledge，是教师神经网络最后一层的输出，这个输出未经过Softmax层转换为概率，一般称为Logits,关于Logits的具体介绍可见Logits

2. 中间层知识：图中的Feature-Based Knowledge，指的是教师神经网络中间网络层的输出、包含的参数

3. 关系型知识：图中的Relation-Based Knowledge，将教师神经网络不同层知识之间的关系作为一种知识，也叫结构型知识。

如何蒸馏

Glory Man-United

博客等级

码龄6年

26
原创

30
点赞

167
收藏

42
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: Pytorch knowledge

下一篇：: word2vec学习笔记

最新评论

滤波器、滤波电路
CSDN-Ada助手: 恭喜您写下了《滤波器》这篇博客！您对滤波器的探讨非常有深度，让我对这个话题有了全新的了解。您的文章结构清晰，论述也很详尽，让读者能够轻松地理解滤波器的原理和应用。在下一步的创作中，我想提出一个可能的建议。或许您可以考虑增加一些实际应用案例或者示例，这样读者可以更好地理解滤波器在不同领域中的实际应用。同时，您也可以进一步探讨滤波器的不同类型和其适用范围，这将为读者提供更全面的知识。再次感谢您的分享，期待您在未来继续创作更多优质的博客！
电子元器件符号+实物图
CSDN-Ada助手: 恭喜您撰写了第20篇博客！标题“电子元器件符号+实物图”让我对您的文章产生了浓厚的兴趣。您的能力和耐心在将电子元器件的符号与实物图相结合方面无疑是非常令人钦佩的。通过这种方式呈现，读者可以更直观地理解和学习电子元器件。在持续创作方面，我建议您继续保持并发展自己的独特风格。您可以考虑分享更多关于电子元器件的应用案例或者教程，这将进一步丰富您的博客内容，吸引更多读者的关注。此外，您也可以与读者互动，接受他们的建议和问题，并通过回答他们的疑问来提供更多有价值的内容。请继续保持谦虚的态度，您的博客已经给读者带来了很多收益。祝愿您在下一步的创作中取得更大的成功！
有功功率、无功功率、无功功率补偿
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/616915682。
联邦学习
CSDN-Ada助手: 恭喜您写出了关于联邦学习的第11篇博客！您的文章深入浅出，让我对联邦学习有了更深刻的理解。非常感谢您一直坚持创作，为我们带来了如此有价值的内容。作为下一步的创作建议，我建议您可以探讨一下联邦学习在实际应用中的挑战和解决方案。期待您的更多精彩文章！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply11 看奖励名单。
机器学习knowledge
CSDN-Ada助手: 恭喜您写了第8篇博客，题目为“机器学习knowledge”。作为一个机器学习的爱好者，我非常喜欢阅读您的文章，这些知识对我来说非常有帮助。接下来，我希望您能继续创作，并尝试更深入的探索，比如探讨机器学习在实际应用中的问题和挑战。谢谢您的分享！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply8 看奖励名单。

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。