【数据增强】综述：A survey on Image Data Augmentation for Deep Learning

zzl_1998

已于 2023-03-13 14:46:46 修改

阅读量3.4k

点赞数 4

文章标签：深度学习机器学习人工智能

于 2020-07-17 20:17:33 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40731332/article/details/107416552

版权

主体部分来自论文《A survey on Image Data Augmentation for Deep Learning》，新增了一些近年的论文。

我认为问题的根本在于模型学习了数据中的bias。一个过拟合的模型会去学习数据中存在的bias，如人脸识别中的position bias，或是普遍存在的lighting bias等。在风格迁移中，会称为不同的domain，如白天/夜晚，雨天/晴天等。解决问题有两个思路：

1. 模型本身。控制模型的复杂度，使得模型去学习general而不是special的特征。比如通过dropout，使得模型不要太依赖一些局部特征，通过batch normalization，得到稳定的分布，避免复杂的函数去拟合。

2. 数据，打破数据中的偏见。比如风格迁移添加黑夜黄昏的图片等。

但在对抗攻击中我们会发现，图片小的改变就可能导致结果的巨变，这说明我们很难通过穷举所有的domain去让模型专注目标本身。因此我觉得Mixup类思路很巧妙，通过线性按比例相加生成新的图片和标签，让数据去“线性化”模型，使得模型尽可能简单。

我们的根本目标是让模型专注于目标的特征，而不是背景：避免模型复杂化（Mixup和cutout类算法，可以把避免模型过拟合的方法迁移过来）和减少数据bias。

整理了大部分数据增强方法的实现，和Learning data augmentation strategies for object detection、GridMask和Augmentation for small object detection三篇论文的方法，欢迎指出问题和star.

GitHub - zzl421/Data_Augmentation_Zoo_for_Object_Detection: Includes: Learning data augmentation strategies for object detection | GridMask data augmentation | Augmentation for small object detection in Numpy. Use RetinaNet with ResNet-18 to test these methods on VOC and KITTI.

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。