论文解读：Self-Distillation from the Last Mini-Batch for Consistency Regularization

littletomatodonkey

已于 2022-05-03 21:42:24 修改

阅读量803

点赞数

分类专栏：知识蒸馏计算机视觉论文-训练技巧-工具文章标签： batch 深度学习人工智能

于 2022-05-03 21:24:02 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012526003/article/details/124560997

版权

知识蒸馏同时被 2 个专栏收录

12 篇文章 17 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

计算机视觉论文-训练技巧-工具

6 篇文章 1 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

这篇博客介绍了CVPR2022会议上发表的论文《Self-Distillation from the Last Mini-Batch for Consistency Regularization》。论文提出了一种新的自我蒸馏方法——DLB，它通过对同一小批量数据在连续迭代中的预测一致性进行蒸馏，以实现正则化。DLB方法不需要修改模型结构，与传统的知识蒸馏相比，代码改动量小且计算过程更灵活。实验结果显示，这种方法在多个数据集和模型上均表现出优越的性能，提高了模型的鲁棒性。作者建议未来在更大的数据集如ImageNet1k上进一步验证其效果。

摘要由CSDN通过智能技术生成

1. 论文基本信息

论文：Self-Distillation from the Last Mini-Batch for Consistency Regularization
地址：https://arxiv.org/pdf/2203.16172.pdf
代码：https://github.com/Meta-knowledge-Lab/DLB
会议：CVPR2022

2. 背景与摘要

关于知识蒸馏方法的研究其实已经很多了，知识蒸馏本质上是一种正则化方法，图像分类任务中，在加上蒸馏之后，数据集的train acc基本上都有所降低，而eval acc在参数合适的情况下，基本都会有所提升。

使用教师模型进行知识蒸馏，一般来说对机器的计算能力要求比较高，同时过程也比较繁琐。以往的自蒸馏策略一般需要改变模型结构，比如加入attention block或者dropout等。本文对这种自蒸馏策略进行改进，基于对相同batch 数据的预测结果一致性进行蒸馏，最终提出了DLB蒸馏方法，达到了SOTA。

3. DLB方法流程图

DLB方法流程图如下，在每次迭代的时候，每个batch的数据包含

了解本专栏

超级会员免费看

littletomatodonkey

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

littletomatodonkey 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。