关于图像的数据增强_scale 数据增量-CSDN博客

本文链接：https://blog.csdn.net/u014410989/article/details/102761411

1. 哪些现象说明“数据量”成为了算法性能瓶颈

1.1 欠拟合的时候可以暂时不考虑增大数据量

如果模型欠拟合，可以尝试改用更复杂的模型，改用更先进的训练算法，增大训练epoch num。

1.2 过拟合的时候可以增大数据量或者使用数据增强

在深度学习中，更多的数据可以有效抑制过拟合，这主要得益于更多的数据可以提高训练集的丰富性，降低训练集和验证集之间的variance。
在数据有限的情况下，对数据进行扩充，可以极大提高算法准确率。
不只是 “数据数量”，好需要关注“数据质量”。例如：人脸识别项中，采集图像时人脸位置、大小、方向、图像质量等。

2. 数据量太少引起过拟合怎么办

2.1 选用简单的网络模型

2.2 使用正则化方法

权重衰减，dropout，stochastic depth等方法，是专门设计来限制模型的有效容量的，用于减少过拟合，这一类是显式的正则化方法。研究表明这一类方法可以提高泛化能力，但并非必要，且能力有限，而且参数高度依赖于网络结构等因素。

2.3 使用预训练网络

找个Imagenet数据集上训练好的的模型，冻结最后一层或者最后几层，然后迁移学习+fine tuning。

2.4 使用多任务学习

例如：行人分割借鉴行人骨架

2.5 有效利用其他规模较大的数据集

商汤智能视频团队在目标跟踪领域做了一系列经典工作，其中DaSiamRPN（ECCV 18）更好地利用了训练数据，增强了网络的判别能力。
与ImageNet相比，之前训练目标跟踪网络能用的训练集物体类别过少，限制了跟踪的性能。同时，在之前的训练方式中，负样本只有背景信息，一定程度上也限制了网络的判别能力。DaSiamRPN 针对这两个问题，设计了两种数据增强方式：

在 DaSiamRPN 中，COCO 和 ImageNet Det 也被引入了训练，极大地丰富了训练集中的类别信息。同时，数据量增大的本身也带来了性能上的提升。
在孪生网络的训练过程中，通过构造有语意的负样本对来增强跟踪器的判别能力。
参考：
目标跟踪最强算法开源：商汤SiamRPN系列解读
 商汤SiamRPN系列项目地址

2.6 使用数据增强技术

3 图像数据增强的方法

3.1 初级方法

图像数据增强一般比较有效的有random crop, random mirror, random resize (scale augmentation)。以上三种实现简单而且有效，基本能复现resnet的结果。至于color augmentation, random rotation, aspect ratio augmentation感觉效果几乎没有，尤其是color augmentation，貌似还有一点点反作用。

在这里插入图片描述