GridMask:SOTA 数据增广方法,显著改进分类、检测、分割效果

点击我爱计算机视觉标星,更快获取CVML新技术


本文为52CV粉丝CrazyVertigo投稿,原文链接:

https://zhuanlan.zhihu.com/p/103992528

给大家介绍一篇非常简单又提点效果明显的2020年最新论文,通过GridMask数据增强方法提升模型鲁棒性,在图像分类、检测、分割三个问题上都做了实验,提升效果明显,好于当前SOTA 的autoaugment。

论文地址:

https://arxiv.org/abs/2001.04086

github地址:

https://github.com/akuxcw/GridMask

GridMask方法在分类、检测、分割三个问题都做了实验,效果提升明显。分类在ImageNet和CIFAR10数据集,评估指标是TOP1 accuracy;检测在COCO数据集,评估指标是map;分割问题在Cityscapes数据集,评估指标是mIOU.

1.Gridmask方法介绍

1.1 超参数的定义

GridMask是通过生成1个和原图相同分辨率的mask,然后将该mask和原图相乘得到一个GridMask增强后的图像。上图中灰色区域的值为1,黑色区域的值为0。通过将Mask和原图相乘,实现了特定区域的information dropping,本质可以理解成是一种实现正则化的方法。
一个GridMask对应4个参数,分别是x,y,r和d,通过这4个参数确定一组特定的mask.实际应用的过程中,还对该Mask进行了旋转。
首先定义k,即图像信息的保留比例,其中H和W分别是原图的高和宽,M是保留下来的像素数,保留比例k如上,该参数k和上述的4个参数无直接关系,该参数间接定义了r。
r的定义通过k可以转换得到
另外2个参数x和y也是定义为一定区域的随机

1.Gridmask方法介绍

1.2 超参数的影响

  • 超参数中的r该如何选择?

GridMask的4个超参数中的r在ImageNet上设置为0.6效果最佳,cifar10中设置为0.4效果最佳。文章中给的建议是分类任务越复杂,r适当越大效果越好。
  • 超参数中的d该如何选择?

GridMask的4个超参数中的d的选择实验结果表示不可以太小(ImageNet输入网络的分辨率为224*224),设置为[96,224]时效果最好,为77.89%
  • 使用过程中该以多大的概率p对训练图像进行GridMask增强?

这里或许大家会有思考,我在图上的不同unit区域中,进行随机的information drop是否可以,会有效果吗? 文章中实验给出结论:不行。
  • GridMask方法如何使用?

1.文章中设计了2中方法,第一种方法是设置一定的概率p,从开始训练就对训练图片以概率p进行数据增强;第二种方法是一开始概率为0,随着训练次数增加对训练图片进行gridmask增强的方法逐渐增大,最后变为p。实验结果结论是第二种方法好于第一种方法。

2.我做实验的时候,是简单的将COCO训练集进行一次离线的数据增强,训练数据量double了一倍,保持相同的epoch,会提升1+点。


1.3 数据增强方法回顾

常用的数据增强方法主要分为3类:

1.空间变换,random scale, crop, flip,rotation

2.颜色扭曲,改变透明度,亮度等

3.信息删除,random erasing, cutour, hide-and-seek

本文提出的GridMask方法属于信息删除的方法,这种方法的实现方式是随机在图像上丢弃一块区域,作用相当于是在网络上增加一个正则项,避免网络过拟合,相比较改变网络结构来说,这种方法只需要在数据输入的时候进行增广,简单便捷。

本文提出的GridMask方法属于信息删除的方法,这种方法的实现方式是随机在图像上丢弃一块区域,作用相当于是在网络上增加一个正则项,避免网络过拟合,相比较改变网络结构来说,这种方法只需要在数据输入的时候进行增广,简单便捷。

2.Gridmask效果提升

2.1 分类实验提升

  • 在ImageNet上效果怎么样?

ImageNet数据集也有1点+较明显的提升,效果好于当前的SOTA方法autoAugment,关键的关键是autoAugment是通过好多好多卡通过搜索的方法实验得出结果,对于工程人员用于实际提升项目用处不大,而GridMask则简单高效又好用,十分推荐。
  • 在Cifar10上效果怎么样?

Cifar10数据集用补充了其他几种information droping的实验,例如Randomearsing,Cuout,Has,Autoaugment等。

2.2 检测实验提升

  • 在COCO上效果怎么样?

检测的实验gridmask的参数r根据经验设置成0.5,训练的时候一张图做不做gridmask增强也是一个超参数,上图做对比实验发现设置成0.7效果最好,有0.9的提升。训练更长的时间可以进一步提升,如上图Faster-RCNN-50-FPN(4x)所示,最终提升1.9个点。

自己使用mmdetection框架在faster-rcnn-resnet50网络上也有1+点的明显提升,后续会在业务相关的数据集上做实验。

2.3分割实验提升

  • 在Cityscapes上效果怎么样?

分割实验在PSPNet50和PSPNet101也有不同程度的效果提升。

参考文章:

1.GridMask Data Augmentation (GridMask)

2.Improved regularization of convolutional neural networks with cutout (Cutout)

3.Hide-and-seek: A data augmentation technique for weakly-supervised localization and beyond (HAS)

4. Cutmix: Regularization strategy to train strong classifiers with localizable features (CutMix)

5. Cutmix: Regularization strategy to train strong classifiers with localizable features (Mixup)

6. Dropblock: A regularization method for convolutional networks (Label Smoothing)

7. Autoaugment: Learning augmentation strategies from data (AutoAugment)


数据标注与增广交流群

关注最新最前沿的数据标注方法及工具、数据增广技术,扫码添加CV君拉你入群,(如已为CV君其他账号好友请直接私信)

(请务必注明:增广)

喜欢在QQ交流的童鞋,可以加52CV官方QQ群:805388940。

(不会时时在线,如果没能及时通过验证还请见谅)


长按关注我爱计算机视觉

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值