目标检测训练trick超级大礼包—不改模型提升精度,值得拥有

点击我爱计算机视觉标星,更快获取CVML新技术


昨日新上arXiv的一篇论文《Bag of Freebies for Training Object Detection Neural Networks》,来自Amazon的研究人员(包括李沐大神)送上了训练目标检测神经网络的trick超级大礼包,相同的网络架构使用大礼包后精度改进明显,值得收藏。

代码也已开源,可谓实用之佳作。

作者信息:

下图展示了使用此trick大礼包训练Faster RCNN和YOLOv3之后,获得的精度增益,相同的算法最多竟有+4.0%AP的增长!

论文使用了dramatically(戏剧性地)这个词来修饰,实不为过!

训练技巧

作者们在文章主要公布了以下训练实用技巧:

1.视觉一致的Image Mixup(Visually Coherent Image Mixup for Object De- tection)

Image Mixup已经成功用于图像分类的样本增广,做法非常简单,图像简单按照比例进行像素混合,如下图:

同样,将带有目标的两幅图像也可以像素混合,生成新的图像含有含有原来的目标,用在目标检测的Image Mixup示意如下:

2.分类头标签平滑(Classification Head Label Smoothing)

3.数据预处理(Data Pre-processing)

主要是随机几何变换和颜色扰动。

4.训练调度程序改造(Training Scheduler Revamping)

改进学习率的衰减方法,使用cosine schedule 代替step schedule取得了更好的结果,如下图:

 

5.同步批归一化(Synchronized Batch Normalization)

方便多GPU训练。

6.随机形状训练(Random shapes training for single-stage object detection networks)

实验结果

作者首先研究了使用上述trick大礼包(文中以BoF代之)后对目标检测中各个类的影响。

在COCO数据库上,如下图所示,红色代表精度提高,可见绝大部分类别检测精度提高。尤其是Faster RCNN算法,几乎都是明显地正增长。

下图是YOLOv3和Faster RCNN在Pascal VOC 2007 test set上的结果,改进非常明显!

下图是在MS COCO 2017 val set上的结果,同样两种目标检测算法都获得精度提升。

算法检测结果示例:

代码论文地址

https://arxiv.org/abs/1902.04103v1

https://github.com/dmlc/gluon-cv

加群交流

关注目标检测技术,欢迎加入52CV-目标检测交流群一起学习,扫码添加52CV君拉你入群,

(请务必注明:目标检测)

习惯在QQ交流的童鞋,可以加52CV官方QQ群:928997753。

(不会时时在线,如果没能及时通过验证还请见谅)

更多CV技术干货请浏览:

"我爱计算机视觉"干货集锦分类汇总(2019年1月20日)


长按关注我爱计算机视觉

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值