pytorch中图像的数据格式

最新推荐文章于 2024-03-09 09:35:35 发布

VIP文章 gaishi_hero

最新推荐文章于 2024-03-09 09:35:35 发布

阅读量9.9k

点赞数 6

分类专栏： pytorch 文章标签： pytorch 图像格式

本文链接：https://blog.csdn.net/gaishi_hero/article/details/81153361

版权

计算机视觉方面朋友都需要跟图像打交道，在pytorch中图像与我们平时在matlab中见到的图像数据格式有所不同。matlab中我们通常使用函数imread()来轻松地读入一张图像，我们在变量空间中可看到数据的存储方式是H x W x C的顺序（其中H、W、C分别表示图像的高、宽和通道数，通道数一般为RGB三通道），另外，其中的每一个数据都是[0,255]的整数。

在使用pytorch的时候，我们通常要使用pytorch中torchvision包下面的datasets模块和transforms模块。而通常情况下在我们使用了这两个模块之后，所处理的图像数据格式已经不是我们所熟知的格式了。下面按照代码来进行讲解：

#导入需要的包和模块
import torch
from torchvision import datasets, transforms
import os

#transforms指明了需要对原始图像做何种变换
data_transforms = transforms.Compose([
        transforms.RandomResizedCrop(224),
        transforms.RandomHorizontalFlip(),
        transforms.ToTensor(),
        transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
    ])

#指明了图像存放的位置；里面可能有好几个文件夹，分别存放不同种类的图像
data_dir = 'original_data'
image_dataset = datasets.ImageFolder(data_dir, data_transforms)

最低0.47元/天解锁文章

gaishi_hero

关注

6
点赞
踩
19

收藏

觉得还不错? 一键收藏
1
评论
pytorch中图像的数据格式

计算机视觉方面朋友都需要跟图像打交道，在pytorch中图像与我们平时在matlab中见到的图像数据格式有所不同。matlab中我们通常使用函数imread()来轻松地读入一张图像，我们在变量空间中可看到数据的存储方式是H x W x C的顺序（其中H、W、C分别表示图像的高、宽和通道数，通道数一般为RGB三通道），另外，其中的每一个数据都是[0,255]的整数。在使用pytorch的时候，我...
复制链接

扫一扫