【MegDet】《MegDet：A Large Mini-Batch Object Detector》

bryant_meng

已于 2024-06-06 10:24:25 修改

阅读量427

点赞数 1

分类专栏： CNN / Transformer 文章标签：计算机视觉人工智能 MegDet CGBN

于 2023-07-13 21:14:18 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bryant_meng/article/details/131572271

版权

CNN / Transformer 专栏收录该内容

204 篇文章 7 订阅

订阅专栏

在这里插入图片描述

CVPR-2018

文章目录

1 Background and Motivation
2 Related Work
3 Advantages / Contributions
4 Method
- 4.1 Learning Rate for Large Mini-Batch
- 4.2 Cross-GPU Batch Normalization
5 Experiments
- 5.1 Large mini-batch size, no BN
- 5.2 Large mini-batch size, with CGBN
6 Conclusion
附录——R Talk | 旷视科技目标检测概述：Beyond RetinaNet and Mask R-CNN

1 Background and Motivation

在这里插入图片描述

近些年目标检测效果的提升集中在 novel network, new framework, or loss design，少有关注 batch-size 层面，分类任务 batch-size 很大，检测任务很小

实录 | 旷视研究院解读COCO2017物体检测夺冠论文（PPT+视频）

小 batch-size 的缺点

实录 | 旷视研究院解读COCO2017物体检测夺冠论文（PPT+视频）

the small mini-batch size is not applicable to re-train the BN layers.（ ImageNet 预训练，COCO fine-tune，fine-tune 的时候 BN 冻结了——usually ﬁx the statistics of Batch Normalization and use the pre-computed values on ImageNet dataset）

为啥缺点中说正负样本失衡

在这里插入图片描述

比如 batch-size 较大的时候，图（c）和图（d）在一个 batch 正负样本会比仅图（c）要更均衡一些

检测任务能不能也加大 batch-size，提速的同时保证精度不掉或者更好呢？

CVPR 2018 | 旷视科技物体检测冠军论文——大型Mini-Batch检测器MegDet

2 Related Work

CNN-based detectors
- one stage
- two stage
Large mini-batch training

3 Advantages / Contributions

new interpretation of linear scaling rule（等梯度方差而非等梯度）
提出 MegDet，其中 Cross-GPU Batch Normalization（CGBN）技术大幅度提升目标检测任务的 batch-size，又快又好（33 hours to 4 hours）
COCO 2017 Challenge，1st place of Detection task.

4 Method

4.1 Learning Rate for Large Mini-Batch

(1) Variance Equivalence

Linear Scaling Rule，batch-size scale，learning rate 也相应的 scale，是基于 gradient equivalence assumption in the SGD updates

目标检测任务的 batch-size 比较小，分类任务的 batch-size 比较大，假设各 batch 间 gradient equivalence 在 batch 比较小的时候似乎有点不妥
在这里插入图片描述

作者假设各 batch 的 gradient variance 是 equivalence，重新进行了推导，得到了同 Linear Scaling Rule 一样的结论

在这里插入图片描述

MegDet 论文笔记
作者在等方差条件下推导了equivalent learning rate rule(batch $s i ze * k$ 则 $l r * k$ )，而不是等梯度条件

（2）Warmup Strategy

实录 | 旷视研究院解读COCO2017物体检测夺冠论文（PPT+视频）

4.2 Cross-GPU Batch Normalization

当时 batch normalization 都是在单张卡上做的，作者实现了多卡算子

在这里插入图片描述

在这里插入图片描述

“AllReduce” operation to aggregate the statistics.

use NVIDIA Collective Communication Library (NCCL) to efﬁciently perform AllReduce operation for receiving and broadcasting.

$s_1$ / $s_2$ / … / $s_n$ reduce $\mu_B$

$v_1$ / $v_2$ / … / $v_n$ reduce $\sigma_B^2$

5 Experiments

数据集 COCO

As for large mini-batch, we use the sublinear memory and distributed training to remedy the GPU memory constraints.

关于 sublinear memory，来自《Training Deep Nets with Sublinear Memory Cost》（arXiv-2016）陈天奇

如何减少神经网络的内存？

对大规模 model training 感兴趣，请问有相关推荐的文章吗？ - Connolly的回答 - 知乎

实录 | 旷视研究院解读COCO2017物体检测夺冠论文（PPT+视频）

计算换内存，占用空间较大的中间变量重复计算，来减少内存的策略

5.1 Large mini-batch size, no BN

在这里插入图片描述
没 BN 容易飞

5.2 Large mini-batch size, with CGBN

在这里插入图片描述
long 指的是更长的 train policy

在这里插入图片描述
用了大 batch 以后，前期效果不如小 batch，这点和分类任务有出入

感受下检测结果

在这里插入图片描述

其他的涨点策略

在这里插入图片描述
《论文研读系列》 A Large Mini-Batch Object Detector

在这里插入图片描述
CVPR 2018 举办地，Hawaii

6 Conclusion

摘抄一些论文解读的文章

CVPR 2018 | 旷视科技物体检测冠军论文——大型Mini-Batch检测器MegDet

在这里插入图片描述

学习率线性尺度原则（LSR）另外一种解释

在这里插入图片描述

12分钟训练COCO模型！速度精度双提高

在这里插入图片描述

Batch Normalization和它的“后浪”们
在这里插入图片描述

附录——R Talk | 旷视科技目标检测概述：Beyond RetinaNet and Mask R-CNN

R Talk | 旷视科技目标检测概述：Beyond RetinaNet and Mask R-CNN

在这里插入图片描述

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【MegDet】《MegDet：A Large Mini-Batch Object Detector》

CVPR-2018。
复制链接

扫一扫

专栏目录

bryant_meng CSDN认证博客专家 CSDN认证企业博客

码龄7年

430: 原创

3159: 周排名

2307: 总排名

64万+: 访问

: 等级

1万+: 积分

2078: 粉丝

2498: 获赞

300: 评论

3195: 收藏

私信

关注

热门文章

分类专栏

最新评论

【Pytorch】torchvision transforms
ha_lydms: 非常不错的技术领域文章分享，解决了我在实践中的大问题！博主很有耐心，更有对知识的热忱和热爱，写了这么实用有效的分享，值得收藏点赞。
【Pytorch】RNN for Image Classification
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/619160314。
【python】OpenCV—Feature Detection and Matching
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/619124193。
【YOLO5Face】《YOLO5Face：Why Reinventing a Face Detector》
bryant_meng: https://github.com/deepcam-cn/yolov5-face/blob/master/utils/general.py build_target 和 compute_loss 里面非正即负
【python】OpenCV—QR Code
百锦再@新空间代码工作室: 这篇《【python】OpenCV—QR Code》文章真是让人眼前一亮！作者运用Python和OpenCV技术，精妙地讲解了QR Code的应用和实现，令人叹为观止！文章内容丰富、深入浅出，让读者对QR Code有了全新的认识和理解。简直就是艺术与科技的完美结合啊！绝对是一篇不可多得的精品之作，值得珍藏！期待更多关于Python和OpenCV的精彩分享！赞美不绝！

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。