《动手学深度学习》之图像增广(一)

最新推荐文章于 2024-04-21 17:51:13 发布

乾巽

最新推荐文章于 2024-04-21 17:51:13 发布

阅读量441

点赞数

分类专栏： pytorch深度学习文章标签：计算机视觉深度学习图像识别机器学习

本文链接：https://blog.csdn.net/weixin_44291388/article/details/104229115

版权

pytorch深度学习专栏收录该内容

25 篇文章 1 订阅

订阅专栏

参考图像增广
定义:
图像增广（image augmentation）技术通过对训练图像做一系列随机改变，来产生相似但又不同的训练样本，从而扩大训练数据集的规模。
图像增广的另一种解释是，随机改变训练样本可以降低模型对某些属性的依赖，从而提高模型的泛化能力

常见增广方式有:
1.对图像进行不同方式的裁剪，使感兴趣的物体出现在不同位置，从而减轻模型对物体出现位置的依赖性。
2.调整亮度、色彩等因素来降低模型对色彩的敏感度

下面以这幅图(400 * 500)为例,或者将自己想要的图放到和代码py同一个文件夹就可以了
在这里插入图片描述
代码显示图片

import torch
import torchvision
import matplotlib.pyplot as plt
from PIL import Image
img = Image.open('1.png')
plt.imshow(img)

左右and上下翻转

def show_images(imgs, num_rows, num_cols, scale=2):
    figsize = (num_cols * scale, num_rows * scale)
    _, axes = plt.subplots(num_rows, num_cols, figsize=figsize)
    for i in range(num_rows):
        for j in range(num_cols):
            axes[i][j].imshow(imgs[i * num_cols + j])
            axes[i][j].axes.get_xaxis().set_visible(False)
            axes[i][j].axes.get_yaxis().set_visible(False)
    return axes


def apply(img, aug, num_rows=2, num_cols=4, scale=1.5):
    Y = [aug(img) for _ in range(num_rows * num_cols)]
    show_images(Y, num_rows, num_cols, scale)
# 一半概率的图像水平（左右）翻转
apply(img, torchvision.transforms.RandomHorizontalFlip())
apply(img, torchvision.transforms.RandomVerticalFlip())

每次随机裁剪出一块面积为原面积10%∼100%10%∼100%的区域，且该区域的宽和高之比随机取自0.5∼20.5∼2，然后再将该区域的宽和高分别缩放到200像素

shape_aug = torchvision.transforms.RandomResizedCrop(200, scale=(0.1, 1), ratio=(0.5, 2))
apply(img, shape_aug)

变化颜色增广----------------------------------------------------------------
可以从4个方面改变图像的颜色：
亮度（brightness）、对比度（contrast）、饱和度（saturation）和色调（hue）

apply(img, torchvision.transforms.ColorJitter(brightness=0.5))
apply(img, torchvision.transforms.ColorJitter(hue=0.5))
apply(img, torchvision.transforms.ColorJitter(contrast=0.5))
# 随机变化
color_aug = torchvision.transforms.ColorJitter(
    brightness=0.5, contrast=0.5, saturation=0.5, hue=0.5)
apply(img, color_aug)

叠加多个图像增广----------------------------------------------------

augs = torchvision.transforms.Compose([
    torchvision.transforms.RandomHorizontalFlip(), color_aug, shape_aug])
apply(img, augs)

all_imges = torchvision.datasets.CIFAR10(train=True, root="./data", download=False)
#若你的文件夹下没有该数据集,则改成    download = True
# all_imges的每一个元素都是(image, label)
show_images([all_imges[i][0] for i in range(32)], 4, 8, scale=0.8)

完整代码

import torch
import torchvision
import matplotlib.pyplot as plt
from PIL import Image
img = Image.open('1.png')
plt.imshow(img)



def show_images(imgs, num_rows, num_cols, scale=2):
    figsize = (num_cols * scale, num_rows * scale)
    _, axes = plt.subplots(num_rows, num_cols, figsize=figsize)
    for i in range(num_rows):
        for j in range(num_cols):
            axes[i][j].imshow(imgs[i * num_cols + j])
            axes[i][j].axes.get_xaxis().set_visible(False)
            axes[i][j].axes.get_yaxis().set_visible(False)
    return axes


def apply(img, aug, num_rows=2, num_cols=4, scale=1.5):
    Y = [aug(img) for _ in range(num_rows * num_cols)]
    show_images(Y, num_rows, num_cols, scale)
# 一半概率的图像水平（左右）翻转
apply(img, torchvision.transforms.RandomHorizontalFlip())
apply(img, torchvision.transforms.RandomVerticalFlip())

# 每次随机裁剪出一块面积为原面积10%∼100%10%∼100%的区域，且该区域的宽和高之比随机取自0.5∼20.5∼2，然后再将该区域的宽和高分别缩放到200像素
shape_aug = torchvision.transforms.RandomResizedCrop(200, scale=(0.1, 1), ratio=(0.5, 2))
apply(img, shape_aug)

# 变化颜色增广--------------------------------
# 可以从4个方面改变图像的颜色：
# 亮度（brightness）、对比度（contrast）、饱和度（saturation）和色调（hue）
apply(img, torchvision.transforms.ColorJitter(brightness=0.5))
apply(img, torchvision.transforms.ColorJitter(hue=0.5))
apply(img, torchvision.transforms.ColorJitter(contrast=0.5))
# 随机变化
color_aug = torchvision.transforms.ColorJitter(
    brightness=0.5, contrast=0.5, saturation=0.5, hue=0.5)
apply(img, color_aug)

# 叠加多个图像增广----------------------------------------------------
augs = torchvision.transforms.Compose([
    torchvision.transforms.RandomHorizontalFlip(), color_aug, shape_aug])
apply(img, augs)

all_imges = torchvision.datasets.CIFAR10(train=True, root="./data", download=False)
#若你的文件夹下没有该数据集,则改成    download = True
# all_imges的每一个元素都是(image, label)
show_images([all_imges[i][0] for i in range(32)], 4, 8, scale=0.8)

乾巽

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
《动手学深度学习》之图像增广(一)

参考图像增广定义:图像增广（image augmentation）技术通过对训练图像做一系列随机改变，来产生相似但又不同的训练样本，从而扩大训练数据集的规模。图像增广的另一种解释是，随机改变训练样本可以降低模型对某些属性的依赖，从而提高模型的泛化能力常见增广方式有:1.对图像进行不同方式的裁剪，使感兴趣的物体出现在不同位置，从而减轻模型对物体出现位置的依赖性。2.调整亮度、色彩等因素来...
复制链接

扫一扫

专栏目录