【AAAI 2021】零样本知识蒸馏：Data-Free Knowledge Distillation with Soft Targeted Transfer Set Synthesis

最新推荐文章于 2022-10-25 16:56:41 发布

BIT可达鸭

最新推荐文章于 2022-10-25 16:56:41 发布

阅读量1.2k

点赞数

分类专栏：深度学习-模型压缩（蒸馏剪枝量化）文章标签：深度学习人工智能神经网络模型压缩知识蒸馏

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44936889/article/details/119427223

版权

深度学习-模型压缩（蒸馏剪枝量化）专栏收录该内容

70 篇文章 163 订阅 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

本文提出了无数据知识蒸馏的新方法，通过建模教师模型的中间特征空间为多元正态分布，生成高质量的伪样本作为知识传输的载体。此方法在多个网络架构和数据集上优于现有工作，改善了模型压缩的效果。

摘要由CSDN通过智能技术生成

【AAAI 2021】零样本知识蒸馏：Data-Free Knowledge Distillation with Soft Targeted Transfer Set Synthesis

论文地址：
主要问题：
主要思路：
主要贡献：
具体实现：
实验结果：
联系作者：
我的公众号：

论文地址：

https://arxiv.org/abs/2104.04868

主要问题：

实现无数据 KD 的关键思想是生成信息丰富的伪样本，从而可以近似原始训练样本的分布

主要思路：

这篇文章提出了一种新的无数据 KD 方法，即利用多元正态分布对教师的中间特征空间进行建模，并利用该分布生成的软目标标签合成伪样本作为传输集

这样的方法与直接建模软最大空间相比，对较浅层的输出分布进行建模可以获得更广义的软目标

主要贡献：

作者用多元正态分布对教师中间层的特征空间进行建模，并对从该分布中采样的目标优化伪样本，从而提高了合成样本的质量
通过对较浅层的输出分布进行建模，而不是直接建模目标采样的软最大空间，从而获得更广义的软目标，这有助于提高性能
利用各种基准网络架构和数据集进行评估可以发现，该算法比现有工作有了明显的改进

具体实现：

基本符号：

假设知识蒸馏中，教师模型和学生模型的输出分别是：

了解本专栏

超级会员免费看

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
【AAAI 2021】零样本知识蒸馏：Data-Free Knowledge Distillation with Soft Targeted Transfer Set Synthesis

【AAAI 2021】零样本知识蒸馏：Data-Free Knowledge Distillation with Soft Targeted Transfer Set Synthesis论文地址：主要问题：主要思路：主要贡献：具体实现：基本符号：具有多元正态分布的特征空间建模：论文地址：https://arxiv.org/abs/2104.04868主要问题：实现无数据 KD 的关键思想是生成信息丰富的伪样本，从而可以近似原始训练样本的分布主要思路：这篇文章提出了一种新的无数据 KD 方法，即利
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

BIT可达鸭 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。