【WACV 2021】在知识蒸馏中利用噪声信息：Noise as a Resource for Learning in Knowledge Distillation

最新推荐文章于 2024-05-10 20:17:28 发布

BIT可达鸭

最新推荐文章于 2024-05-10 20:17:28 发布

阅读量705

点赞数 1

分类专栏：深度学习-模型压缩（蒸馏剪枝量化）文章标签：计算机视觉深度学习知识蒸馏图像分类模型压缩

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44936889/article/details/119358020

版权

深度学习-模型压缩（蒸馏剪枝量化）专栏收录该内容

70 篇文章 163 订阅 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

论文探讨了在知识蒸馏中噪声的价值，通过Fickle Teacher、Soft Randomization和Messy Collaboration方法，利用噪声提高模型的鲁棒性和泛化能力。实验表明，噪声能改善学生模型的性能，减少对抗性鲁棒性和泛化之间的权衡。

摘要由CSDN通过智能技术生成

【WACV 2021】在知识蒸馏中利用噪声信息：Noise as a Resource for Learning in Knowledge Distillation

论文地址：
主要问题：
主要思路：
具体实现：
联系作者：
我的公众号：

论文地址：

https://arxiv.org/abs/1910.05057

主要问题：

虽然噪声在计算系统中通常被认为是一个麻烦，但神经科学的一些研究表明，神经系统中噪声仍存在一些有用的信息，使得大脑能够执行概率推理等计算，以及携带关于刺激的额外信息

同样地，噪声也已被证明可以提高深度神经网络的性能

主要思路：

这篇论文中作者进一步研究了在知识蒸馏框架中添加噪声的影响，因为它与大脑区域的协作子网络相似，并且作者发现在协作学习框架中注入不同层次的建设性噪声，使我们能够有效地训练模型，并在学生模型中提炼出理想的特征

作者主要提出了三种方法：最小化紧凑模型和大模型（Fickle Teacher）之间的性能差距，训练高性能紧凑的反向鲁棒模型（Soft Randomization），以及在标签噪声下有效地训练模型（Messy Collaboration）

具体实现：

Fic

了解本专栏

超级会员免费看

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

BIT可达鸭 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。