模型蒸馏（Distillation）

最新推荐文章于 2024-03-25 21:55:43 发布

喜欢打酱油的老鸟

最新推荐文章于 2024-03-25 21:55:43 发布

阅读量8.9k

点赞数 3

原文链接：http://blog.itpub.net/69946223/viewspace-2733729/

版权

人工智能专栏收录该内容

4214 篇文章 337 订阅

订阅专栏

模型在训练后需要更改，以创建更紧凑的表示形式。这一过程的主要实现技术包括剪枝（pruning）和知识蒸馏。

知识蒸馏的基本理念，是考虑到较大网络内部存在的稀疏性或冗余性。虽然大规模网络具有较高的表示能力，但如果网络容量未达到饱和，则可以用具有较低表示能力的较小网络（即较少的神经元）表示。在 Hinton 等人 2015 年发表的研究工作中，将 Teacher 模型中转移给 Student 模型的嵌入信息称为“黑暗知识”（dark knowledge）。

下图给出了知识蒸馏的过程：

TinyML：下一轮人工智能革命

图 5 深度压缩过程图

图中 Teacher 模型是经过训练的卷积神经网络模型，任务是将其“知识”转移给称为 Student 模型的，参数较少的小规模卷积网络模型。此过程称为“知识蒸馏”，用于将相同的知识包含在规模较小的网络中，从而实现一种网络压缩方式，以便用于更多内存受限的设备上。

喜欢打酱油的老鸟

关注

3
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
模型蒸馏（Distillation）

模型在训练后需要更改，以创建更紧凑的表示形式。这一过程的主要实现技术包括剪枝（pruning）和知识蒸馏。知识蒸馏的基本理念，是考虑到较大网络内部存在的稀疏性或冗余性。虽然大规模网络具有较高的表示能力，但如果网络容量未达到饱和，则可以用具有较低表示能力的较小网络（即较少的神经元）表示。在 Hinton 等人 2015 年发表的研究工作中，将 Teacher 模型中转移给 Student 模型的嵌入信息称为“黑暗知识”（dark knowledge）。下图给出了知识蒸馏的过程：图 ..
复制链接

扫一扫

专栏目录

喜欢打酱油的老鸟

CSDN认证博客专家 CSDN认证企业博客

码龄6年

1371: 原创

5407: 周排名

24: 总排名

1143万+: 访问

: 等级

11万+: 积分

6170: 粉丝

5427: 获赞

1166: 评论

3万+: 收藏

私信

关注

热门文章

分类专栏

SAP S4HANA 文集(2024) 7篇
数字化转型 56篇
医药行业 26篇
RPA 9篇
Workflow 4篇
供应链 29篇
OA 3篇
HR 3篇
SAP文章 1469篇
综合IT 101篇

最新评论

任正非：管理就要铲除公司夹心层！
2301_82244392: 干货满满，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
为什么自动驾驶遇瓶颈，但自动代客泊车却很热？
2401_84140776: 这篇文章是优质之作，内容充实，结构明晰，语言流畅且通俗易懂，适合广大读者阅读。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
2018中国移动机器人行业十大热词
HUAXIAL: 写的很好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
北欧小国的宏大AI实验：让1%的人口接受人工智能培训
m0_60607245: 引领技术潮流，是不可多得的好文，十分值得借鉴和参考。期待博主未来能够持续分享更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
「SAP技术」SAP业务操作查询里的通配符
m0_64980521: 请问如何排除单值查询呢？例如不要（冻结）物料时

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。