Datawhale AI 夏令营Task03:数据增强，提升模型表现

最新推荐文章于 2024-07-26 13:24:37 发布

Amelia&pku

最新推荐文章于 2024-07-26 13:24:37 发布

阅读量700

点赞数 26

文章标签：人工智能 python 计算机视觉

本文链接：https://blog.csdn.net/github_74952777/article/details/140552618

版权

写在前面

不知不觉，DataWhale的夏令营CV图像方向的学习已接近尾声。今天来进行最后一次的理论学习吧。

首先，我们进行数据增强的基准是一张猫猫的照片，接下来用torchversion进行处理的原始图片都是这只猫猫，如下：

数据增强基础

首先，数据增强是什么呢？我为什么需要对数据进行增强？既然大家是CV图像方向的，那我们在处理我们的数据（图片）时，总会感叹图像数量太少了，这可能是拍摄的时候拍少了，也可能是数据集就这么大，我们人为做不了修改（除了PS软件，但是大批量的也不好处理），所以就有了数据增强，我们通过数据增强来产生更多的数据，以进行训练。

以下是术语表示：

数据增强是一种在机器学习和深度学习领域常用的技术，尤其是在处理图像和视频数据时。

数据增强的目的是通过人工方式增加训练数据的多样性，从而提高模型的泛化能力，使其能够在未见过的数据上表现得更好。

数据增强涉及对原始数据进行一系列的变换操作，生成新的训练样本。这些变换模拟了真实世界中的变化，对于图像而言，数据增强包括例如视角、光照、遮挡等情况，使得模型能够学习到更加鲁棒的特征表示。

但是使用数据增强还有一个问题就是如果变换操作与目标任务的实际场景不符，比如在不需要旋转的图像任务中过度使用旋转，那么这些变换可能会引入无关的噪音。

此外过度的数据增强，比如极端的亮度调整、对比度变化或大量的噪声添加，可能会导致图像失真，使得模型难以学习到有效的特征。

在之前的代码中我们就曾使用PyTorch框架来加载和增强图像数据：

图像大小调整：使用transforms.Resize((256, 256))将所有图像调整到256x256像素的尺寸，这有助于确保输入数据的一致性。
随机水平翻转：transforms.RandomHorizontalFlip()随机地水平翻转图像，这种变换可以模拟物体在不同方向上的观察，从而增强模型的泛化能力。
随机垂直翻转：transforms.RandomVerticalFlip()随机地垂直翻转图像，这同样是为了增加数据多样性，让模型能够学习到不同视角下的特征。
转换为张量：transforms.ToTensor()将图像数据转换为PyTorch的Tensor格式，这是在深度学习中处理图像数据的常用格式。
归一化：transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])对图像进行归一化处理，这里的均值和标准差是根据ImageNet数据集计算得出的，用于将图像像素值标准化，这有助于模型的训练稳定性和收敛速度。