《动手学深度学习》图像增广（数据增强）

最新推荐文章于 2023-07-08 15:03:29 发布

Nick_Spider

最新推荐文章于 2023-07-08 15:03:29 发布

阅读量2k

点赞数

分类专栏： pytorch 机器学习机器视觉文章标签：计算机视觉机器学习深度学习 pytorch python

本文链接：https://blog.csdn.net/weixin_39198406/article/details/104501970

版权

图像增广通过随机变换扩大训练数据集，提升模型泛化能力。本文介绍了使用torchvision库进行图像随机翻转、裁剪、调整亮度色彩等方法，并展示了如何叠加多种图像增强操作，以及将图像转换为张量的步骤。

摘要由CSDN通过智能技术生成

图像增广

图像增广（image augmentation）技术通过对训练图像做一系列随机改变，来产生相似但又不同的训练样本，从而扩大训练数据集的规模。
其优点在于通过随机改变训练样本可以降低模型对某些属性的依赖，从而提高模型的泛化能力。
例如：

对图像进行不同方式的裁剪，使感兴趣的物体出现在不同位置，从而减轻模型对物体出现位置的依赖性。
可以调整亮度、色彩等因素来降低模型对色彩的敏感度。

常用增广方法

我们这里使用torchvision对图像进行处理，torchvision内置了一些图像处理API。
torchvision.transforms下内置各种图像处理方法，调用并输入图像就可以得到处理后的Image对象。
基本调用方法为：

import torchvision
from PIL import Image

img = Image.open('./cat3.jpg')
img = torchvision.transforms.RandomHorizontalFlip()(img)

我们这里写一个函数方便测试：

def deal_single_img(path, deal_function):
    d2l.set_figsize()
    img2 = Image.open(path)
    origin_type = type(img2)
    d2l.plt.imshow(img2)
    plt.show()
    img2 = deal_function(img

最低0.47元/天解锁文章

Nick_Spider

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录