深度学习中的数据增强

01_6

于 2024-07-25 20:48:12 发布

阅读量186

点赞数 7

文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_77444219/article/details/140699295

版权

目录

3.RandomRotation：

4.CenterCrop：

5.RandomHorizontalFlip：

6.RandomVerticalFlip：

7.ColorJitter：

8.RandomGrayscale：

11.代码示例

在深度学习中，数据增强（Data Augmentation）是一种提高模型泛化能力的技术，通过从现有数据集中生成新的训练样本来增加数据多样性。数据增强尤其对于图像分类、目标检测和语义分割等计算机视觉任务非常有用，因为这些任务通常需要大量的标注数据。本文将以pytorch中的torchvision.transforms为例介绍常见的数据增强技术。

1.ToTensor：

transforms.ToTensor()
# 将 PIL Image 或 Numpy 数组转换为 torch.FloatTensor，并将数值范围从 [0, 255] 缩放到 [0.0, 1.0]

2.Resize：

transforms.Resize([80,80])
# 对图像进行缩放
# 参数：size（一个整数或元组，指定新的尺寸）

3.RandomRotation：

transforms.RandomRotation(45)
# 随机旋转，-45到45度之间随机

4.CenterCrop：

transforms.CenterCrop(64)
# 将图像中心裁剪到指定尺寸
# 参数：size（裁剪后的尺寸）

5.RandomHorizontalFlip：

transforms.RandomHorizontalFlip(p=0.5)
# 随机水平翻转图像
# 参数：p（翻转的概率）

6.RandomVerticalFlip：

transforms.RandomVerticalFlip(p=0.5)
# 随机垂直翻转图像
# 参数：p（翻转的概率）

7.ColorJitter：

transforms.ColorJitter(brightness=0.2, contrast=0.1, saturation=0.1, hue=0.1)
# 随机改变图像的亮度、对比度、饱和度和色调
# 参数1为亮度，参数2为对比度，参数3为饱和度，参数4为变化的范围

8.RandomGrayscale：

transforms.RandomGrayscale(p=0.1)
# 随机将图像转换为灰度图
# 参数：p（转换为灰度的概率）

9.Normalize：

transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
# 标准化图像的像素值，通常用于训练过程中
# 参数：mean（各通道的均值），std（各通道的标准差）

10.Compose：

transforms.Compose
# 组合多个变换
# 参数：transforms（变换列表）

11.代码示例

import torchvision.transforms as transforms

# 定义数据增强操作
transform = transforms.Compose([
    transforms.RandomHorizontalFlip(p=0.5),  # 50%概率水平翻转
    transforms.ColorJitter(brightness=0.2, contrast=0.2, saturation=0.2),  # 随机颜色变换
    transforms.ToTensor(),    # 转换为Tensor
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),  # 标准化
])

# 应用数据增强
# img是一个PIL Image 
img_transformed = transform(img)

关注

7
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
深度学习中的数据增强

在深度学习中，数据增强（Data Augmentation）是一种提高模型泛化能力的技术，通过从现有数据集中生成新的训练样本来增加数据多样性。数据增强尤其对于图像分类、目标检测和语义分割等计算机视觉任务非常有用，因为这些任务通常需要大量的标注数据。本文将以pytorch中的torchvision.transforms为例介绍常见的数据增强技术。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。