数据增强的原理和指导方法

最新推荐文章于 2024-08-12 21:23:23 发布

置顶

行路南

最新推荐文章于 2024-08-12 21:23:23 发布

阅读量6.8k

点赞数 16

分类专栏：数据增强文章标签：计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010414589/article/details/114003482

版权

数据增强是解决深度学习过拟合问题的有效方法，包括离线和在线两种形式。通过对图像进行翻转、旋转、平移等几何变换，以及颜色空间变换、内核过滤器等操作，增加数据多样性，提高模型的泛化能力。本文详细介绍了数据增强的原理、形式及常用方法，并提及了Albumentation等数据增强库的应用。

摘要由CSDN通过智能技术生成

一、数据增强产生的背景

深度学习网络在处理计算机视觉任务中获得巨大的成功。而这些网络都有着大量的参数，需要大量的数据来学习网络中的参数，从而避免出现过拟合现象。

要解决过拟合问题，目前实施的策略主要分为两个方向：

1.模型结构的改进

Dropout 正则化方法
Batch Normalization 正则化方法
迁移学习

2.数据集的改进

数据增强（本节关注的内容）

数据增强是一种解决过拟合问题的非常有效的方法。它假定可以通过增强从原始数据集中提取出更多的信息，使得增强后的数据集代表更为全面的数据集合，进而缩小训练集和验证集之间的差距。

举一个例子：如果有图像分类的任务，目的是识别两类汽车。而我们已有的数据集，福特的汽车都朝向左边，雪佛兰的汽车都朝向右边。

而真实应用场景中，福特的汽车也可能朝向右边。当我们喂给当今最优秀的分类网络一张朝向右边的福特时，它的结果大概率仍然会识别为雪佛兰。

原因在哪儿呢？我们可以说模型过拟合了，学到了不重要的特征，在测试集上不具有良好的泛化能力。改变的一种方式是可以通过翻转使每个类型的车辆都有左边和右边的图像，就使得网络不会过于关注位置信息，更关注外形、轮廓等信息。

二、数据增强的两种形式

2.1 离线增强

离线数据增强的特点是预先对已有数据集进行所有必要的变换，使得增强后的数据数量变为原始数据数量的N倍（N为增强因子）。

离线数据增强的主要考虑因素是与扩增数据带来的额外内存和计算约束。因此，这种方式更适用于小数据集。

2.2 在线增强

在线数据增强的特

最低0.47元/天解锁文章

关注

16
点赞
踩
67

收藏

觉得还不错? 一键收藏
11
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

行路南 CSDN认证博客专家 CSDN认证企业博客

码龄11年

129: 原创

3万+: 周排名

87万+: 总排名

113万+: 访问

: 等级

5742: 积分

426: 粉丝

614: 获赞

255: 评论

3028: 收藏

私信

关注

热门文章

分类专栏

OpenCV 3篇
C++
语义分割 6篇
图像分类 5篇
数据集 3篇
NVIDIA DeepStream 9篇
LeetCode 8篇
目标检测 4篇
数据增强 1篇
PyTorch 2篇
deep learning 4篇
目标追踪 2篇
自然语言处理 2篇
知识图谱 6篇
matplotlib 1篇
Git 1篇
机器学习 19篇
数据挖掘 22篇
算法 7篇
学习随笔 15篇
Hadoop 8篇
Linux 4篇
软件部署 17篇

最新评论

【PyTorch】torch.mean(), dim=0, dim=1 详解
lanlalala: a tensor([[[ 0., 1., 2., 3.], [ 4., 5., 6., 7.], [ 8., 9., 10., 11.]], [[12., 13., 14., 15.], [16., 17., 18., 19.], [20., 21., 22., 23.]]], dtype=torch.float64) a.shape torch.Size([2, 3, 4]) mean0 tensor([[[ 6., 7., 8., 9.], [10., 11., 12., 13.], [14., 15., 16., 17.]]], dtype=torch.float64) mean0.shape torch.Size([1, 3, 4]) mean1 tensor([[[ 4., 5., 6., 7.]], [[16., 17., 18., 19.]]], dtype=torch.float64) mean1.shape torch.Size([2, 1, 4]) mean2 tensor([[[ 1.5000], [ 5.5000], [ 9.5000]], [[13.5000], [17.5000], [21.5000]]], dtype=torch.float64) mean2.shape torch.Size([2, 3, 1])
【PyTorch】torch.mean(), dim=0, dim=1 详解
lanlalala: 按照楼主的，可供参考 a = torch.arange(24, dtype=float).reshape((2,3,4)) print('a',a) print('a.shape', a.shape) print(" ") mean0 = torch.mean(a, dim=0, keepdims=True) print('mean0', mean0) print('mean0.shape', mean0.shape) print(" ") mean1 = torch.mean(a, dim=1, keepdims=True) print('mean1', mean1) print('mean1.shape', mean1.shape) print(" ") mean2 = torch.mean(a, dim=2, keepdims=True) print('mean2', mean2) print('mean2.shape', mean2.shape)
7G的森林火情数据集，文末附数据集和源代码
qq_56413072: 博主，求一份数据集有没有百度网盘链接
7G的森林火情数据集，文末附数据集和源代码
weixin_43880420: 博主，这个数据集有标注文件嘛？
二叉树的后序遍历
小白 ~forever: 你这页面设计有点离谱，锚点链接不用，用新页面

大家在看

最新文章

目录

评论 11

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。