02-深度学习中的Data Augmentation方法

最新推荐文章于 2025-04-04 18:57:51 发布

Levine-Huang

最新推荐文章于 2025-04-04 18:57:51 发布

阅读量5.3k

点赞数 1

分类专栏：深度学习机器学习文章标签：深度学习

本文链接：https://blog.csdn.net/sinat_25059791/article/details/56664865

版权

本文介绍了深度学习中防止过拟合的方法，重点探讨数据增强（Data Augmentation），包括图像的几何变换如旋转、翻转、缩放和平移。还详细讨论了Keras中的ImageDataGenerator如何实现这些变换，以及参数设置。此外，提到了Label shuffle等其他增广技术，用于处理类别不平衡问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

02-深度学习中的Data Augmentation方法

在深度学习中，为了避免出现过拟合（Overfitting），通常我们需要输入充足的数据量。当数据量不够大时候，常常采用以下几种方法：

Data Augmentation：通过平移、翻转、加噪声等方法从已有数据中创造出一批“新”的数据，人工增加训练集的大小。
Regularization：数据量比较小会导致模型过拟合, 使得训练误差很小而测试误差特别大. 通过在Loss Function 后面加上正则项可以抑制过拟合的产生。缺点是引入了一个需要手动调整的hyper-parameter。
Dropout：这也是一种正则化手段，不过跟以上不同的是它通过随机将部分神经元的输出置零来实现。详见 http://www.cs.toronto.edu/~hinton/absps/JMLRdropout.pdf
Unsupervised Pre-training：用Auto-Encoder或者RBM的卷积形式一层一层地做无监督预训练, 最后加上分类层做有监督的Fine-Tuning。参考 http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.207.1102&rep=rep1&type=pdf