pytorch ImageFolder

参考官方文档:https://pytorch-cn.readthedocs.io/zh/latest/torchvision/torchvision-datasets/#imagefolder

简单使用

ImageFolder是一个很好用的数据加载器
所需要的文件结构如下所示,每一类的图片都在各自类的文件夹下(狗的图片在dog文件夹下,猫的图片在cat文件夹的,而这些类的文件夹都在同一个根目录下)

root/dog/xxx.png
root/dog/xxy.png
root/dog/xxz.png

root/cat/123.png
root/cat/nsdf3.png
root/cat/asd932_.png

调用起来也十分简单
root:数据集根文件夹路径
transform:一个函数,对输入图片的转换,可不写
target_transform:一个函数,对输出图片的转换,可不写

import torchvision.datasets as dset
import torchvision.transforms as transforms
dataSet = dset.ImageFolder(root="root folder path", [transform, target_transform])

他有以下成员变量:

self.classes - 用一个list保存 类名
self.class_to_idx - 类名对应的 索引
self.imgs - 保存(img-path, class) tuple的list

上述内容都可以在官方文档上找到,接下来是一些常用语法

通过下标获取图片的数据和标签

先声明一个dataset

normalize = transforms.Normalize(mean=[0.485, 0.456, 0.406],
                                     std=[0.229, 0.224, 0.225])

traindir = '../labelImage'
trainDataset = datasets.ImageFolder(traindir, transforms.Compose([
            transforms.Resize(128),
            transforms.RandomCrop(112),
            transforms.RandomHorizontalFlip(),
            transforms.ToTensor(),
            normalize,
        ]))

注意dataset可以直接下标访问,所以要想遍历获取图片的tensor和标签十分简单,直接写个for循环就好了

dataSet[i][0]#返回第i张图片的PIL Image对象
dataSet[i][1]#返回第i张图片的标签(一个整数)

在这里插入图片描述

注意到那个标签是一个整数,如果我们想要获得标签的字符串,我们可以用如下语法

dataSet.classes[dataSet[i][1]]

在这里插入图片描述

通过下标获取图片的路径

ImageFolder通过下标获取图片的tensor十分简单,那么如果我们想用下标获取图片的路径呢?
查了好久,官方文档上面好像也没有具体说,通过查找ImageFolder这个类的方法(例如print(dir(dataSet)),其中dataSet是一个ImageFolder对象),我找到了imageFolder有samples这个成员,说明如下

dataSet.samples[i][0]#返回第i张图片的名称
dataSet.samples[i][1]#返回的也是第i张图片的标签(一个整数)和dataSet[i][1]类似

在这里插入图片描述

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值