数据增强（在线数据增强和离线的区别）

TS~~

已于 2022-05-22 17:27:51 修改

阅读量5.4k

点赞数 8

分类专栏：深度学习文章标签：深度学习机器学习计算机视觉

于 2022-05-09 22:31:05 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42305201/article/details/124677151

版权

深度学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

数据增强是提升模型泛化能力的重要手段，包括离线和在线两种方式。离线数据增强适用于小规模数据集，一次性扩充后进行训练；在线数据增强则在每个epoch训练前实时进行，如平移、旋转等操作，确保每次训练的多样性，尽管会降低训练速度。尽管数据增强定义在epoch循环外，但通过dataloader的调用，每个epoch的数据仍然是不同的，增加了训练的样本多样性。

摘要由CSDN通过智能技术生成

数据增强

数据增强分为：在线数据增强和离线数据增强

离线数据增强就是一次性把数据读入内存并扩充好，然后用这个扩充后的数据集进行训练，适用于较小的数据集。
在线数据增强就是现在的深度学习框架中所提供的数据增强方式。在每个epoch训练前，对数据集进行平移，旋转等。

数据增强后每个epoch的训练图片数量并没有变；但是由于增强手段中的随机裁剪，随机畸变等方法中的随机，导致训练中每个epoch的训练图片都不一样，这样就间接导致数据量的增加。（这边一定要注意我们的数据增强方法都是随机的，只有这样每个epoch的数据才会不一样）

在线增强的缺点就是会使训练速度变慢

这里解决一个疑问：就是我们一般将数据增强写在dataset类内，但是dataset是在epoch循环外的，那么每个epoch的数据不都一样了吗？

其实并不是，因为虽然dataset定义在循环外，但是在每个epoch里面都调用了dataloader来加载数据，而dataloader内部调用了dataset类。所以每个epoch的数据都不一样

关注

8
点赞
踩
43

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。