【动手学习pytorch笔记】17.数据增广

最新推荐文章于 2023-10-26 16:05:48 发布

YMK_0

最新推荐文章于 2023-10-26 16:05:48 发布

阅读量651

点赞数

分类专栏： pytorch学习笔记文章标签： pytorch 深度学习

本文链接：https://blog.csdn.net/ymk1998/article/details/123930929

版权

pytorch学习笔记专栏收录该内容

42 篇文章 30 订阅

订阅专栏

本文介绍了深度学习中常用的图像增广技术，包括翻转、裁剪、颜色变化等，以增强模型的泛化能力。通过示例展示了不同增广方法对图像的影响，如随机水平和垂直翻转、随机大小裁剪以及调整亮度、对比度、饱和度和色调。最后，演示了如何组合多种图像增广方法以进一步丰富训练数据。

摘要由CSDN通过智能技术生成

图像增广

%matplotlib inline
import torch
import torchvision
from torch import nn
from d2l import torch as d2l

原图

d2l.set_figsize()
img = d2l.Image.open('../img/cat1.jpg')
d2l.plt.imshow(img);

在这里插入图片描述

大多数图像增广方法都具有一定的随机性。为了便于观察图像增广的效果，我们下面定义辅助函数apply。此函数在输入图像img上多次运行图像增广方法aug并显示所有结果。

def apply(img, aug, num_rows=2, num_cols=4, scale=1.5):
    Y = [aug(img) for _ in range(num_rows * num_cols)]
    d2l.show_images(Y, num_rows, num_cols, scale=scale)

翻转和裁剪

apply(img, torchvision.transforms.RandomHorizontalFlip())

在这里插入图片描述

50%几率左右翻转

apply(img, torchvision.transforms.RandomVerticalFlip())

在这里插入图片描述

50%几率上下翻转

shape_aug = torchvision.transforms.RandomResizedCrop(
    (200, 200), scale=(0.1, 1), ratio=(0.5, 2))
apply(img, shape_aug)

随机裁剪一个面积为原始面积10%到100%的区域，该区域的宽高比从0.5到2之间随机取值。然后，区域的宽度和高度都被缩放到200像素。

在这里插入图片描述

改变颜色

apply(img, torchvision.transforms.ColorJitter(
    brightness=0.5, contrast=0, saturation=0, hue=0))

在这里插入图片描述

apply(img, torchvision.transforms.ColorJitter(
    brightness=0, contrast=0, saturation=0, hue=0.5))

亮度（brightness）、对比度（contrast）、饱和度（saturation）和色调（hue）

在这里插入图片描述

结合多种图像增广方法

augs = torchvision.transforms.Compose([
    torchvision.transforms.RandomHorizontalFlip(), color_aug, shape_aug])
apply(img, augs)

用Compose实例来整合上面定义的不同的图像增广方法

在这里插入图片描述

YMK_0

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【动手学习pytorch笔记】17.数据增广

图像增广%matplotlib inlineimport torchimport torchvisionfrom torch import nnfrom d2l import torch as d2l原图d2l.set_figsize()img = d2l.Image.open('../img/cat1.jpg')d2l.plt.imshow(img);大多数图像增广方法都具有一定的随机性。为了便于观察图像增广的效果，我们下面定义辅助函数apply。此函数在输入图像img上多次运
复制链接

扫一扫

专栏目录