补充知识 —— 数据增强

Monodwj

于 2024-01-27 15:52:57 发布

阅读量627

点赞数 10

文章标签：人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lqqqqqqq123/article/details/135881881

版权

数据增强（data augmentation），其本质是通过使用图像处理方法，通过从现有数据生成新的训练数据来扩展丰富原数据集，以此增加训练样本的数量以及多样性，进而提升模型的泛化能力和鲁棒性。

我们为什么要进行数据增强？

一方面，在某些情况下训练数据的获取并不是一件容易的事情，而优秀的神经网络所需要训练的参数是十分巨大的，我们需要给到与其参数个数成比例的训练样本，过少的样本可能会引起过拟合。这个时候数据扩充就十分有必要了。

另一方面，数据的获取或许具有不均匀性，在某一类别上的样本可能过多或者过少。数据增强可以平衡数据分布。同时，某些图像样本稍微移动视角或改变位置，所识别的结果可能都不一样，数据增强可以拓展样本的多样性，增强网络泛化能力。

数据增强的方法：

数据增强分为离线增强和在线增强。离线增强先进行数据扩充，得到的新数据集直接用以训练，适用于小规模数据集；在线增强在网络模型内部实现小批次的数据扩充，可以使用GPU优化计算，适用于大规模训练集。

几何变换是非常常见的一种数据增强的方法。包括翻转、旋转、缩放、剪裁、平移等等。同时还有颜色替换、噪声引入等。

具体用法可以见链接 https://zhuanlan.zhihu.com/p/632625817

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。