目标检测训练trick超级大礼包—不改模型提升精度，值得拥有

最新推荐文章于 2023-11-06 15:28:25 发布

我爱计算机视觉

最新推荐文章于 2023-11-06 15:28:25 发布

阅读量386

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/moxibingdao/article/details/106666653

版权

点击我爱计算机视觉标星，更快获取CVML新技术

昨日新上arXiv的一篇论文《Bag of Freebies for Training Object Detection Neural Networks》，来自Amazon的研究人员（包括李沐大神）送上了训练目标检测神经网络的trick超级大礼包，相同的网络架构使用大礼包后精度改进明显，值得收藏。

代码也已开源，可谓实用之佳作。

作者信息：

下图展示了使用此trick大礼包训练Faster RCNN和YOLOv3之后，获得的精度增益，相同的算法最多竟有+4.0%AP的增长！

论文使用了dramatically（戏剧性地）这个词来修饰，实不为过！

训练技巧

作者们在文章主要公布了以下训练实用技巧：

1.视觉一致的Image Mixup（Visually Coherent Image Mixup for Object De- tection）

Image Mixup已经成功用于图像分类的样本增广，做法非常简单，图像简单按照比例进行像素混合，如下图：

同样，将带有目标的两幅图像也可以像素混合，生成新的图像含有含有原来的目标，用在目标检测的Image Mixup示意如下：

2.分类头标签平滑（Classification Head Label Smoothing）

3.数据预处理（Data Pre-processing）

主要是随机几何变换和颜色扰动。

4.训练调度程序改造（Training Scheduler Revamping）

改进学习率的衰减方法，使用cosine schedule 代替step schedule取得了更好的结果，如下图：

5.同步批归一化（Synchronized Batch Normalization）

方便多GPU训练。

6.随机形状训练（Random shapes training for single-stage object detection networks）

实验结果

作者首先研究了使用上述trick大礼包（文中以BoF代之）后对目标检测中各个类的影响。

在COCO数据库上，如下图所示，红色代表精度提高，可见绝大部分类别检测精度提高。尤其是Faster RCNN算法，几乎都是明显地正增长。

下图是YOLOv3和Faster RCNN在Pascal VOC 2007 test set上的结果，改进非常明显！

下图是在MS COCO 2017 val set上的结果，同样两种目标检测算法都获得精度提升。

算法检测结果示例：

代码论文地址

https://arxiv.org/abs/1902.04103v1

https://github.com/dmlc/gluon-cv

加群交流

关注目标检测技术，欢迎加入52CV-目标检测交流群一起学习，扫码添加52CV君拉你入群，

（请务必注明:目标检测）

习惯在QQ交流的童鞋，可以加52CV官方QQ群：928997753。

（不会时时在线，如果没能及时通过验证还请见谅）

更多CV技术干货请浏览：

"我爱计算机视觉"干货集锦分类汇总(2019年1月20日)

长按关注我爱计算机视觉

我爱计算机视觉

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。