一篇学会Pytorch数据集下载


前言

数据集是我们在训练模型中经常用到的,那我们该如何下载并进行使用它呢


数据来源

打开pytorch官网
在这里插入图片描述
发现有很多:音频,视觉,文字之类的
以视觉为例打开torchvision
在这里插入图片描述
发现好多数据集已经为我们列出来了.COCO数据集等等
在这里插入图片描述
以第一个数据集为例,点开后发现其用法都在上面了,我们只需要看懂会用即可

代码如下(示例):


## 下载数据

> 当我们选择好一个数据集时,(以CIFAR10为例),我们该如何下载使用呢.

导入相关的包,在pycharm中按ctrl p 会有提示

```python
import torchvision
from torchvision
trainset = torchvision.datasets.CIFAR10(root='./data',train=True,download=True)
  • root是下载到的文件夹
  • train 是否是训练数据, 否则就是测试数据
  • download是否要进行下载

在这里插入图片描述
按照提示输入参数即可
其中transforms是图像所进行的操作
在这里插入图片描述
可以看到有很多操作的类,这里我们以ToTensor 来看按住ctrl 点进去即可看见源码

在这里插入图片描述
大概意思就是将一个PIL或者是numpy类型转换成 tensor数据类型

我们继续来看 数据对象
在这里插入图片描述
在pycharm console种可以看到对象的各个属性对应

在这里插入图片描述

而对应的索引值是一个图片和一个对应的索引
在这里插入图片描述
我们就可以用image对象接受并进行显示

import torchvision
from torchvision import transforms
import  torch.utils.tensorboard.summary
trainset = torchvision.datasets.CIFAR10(root='./data',train=True,download=True)
print(trainset.classes)
image,index = trainset[1]

image.show()
print(trainset.classes[index])

transforms联用

那我们接下来就用tansforms对这些数据集进行,操作

以Totensor为例

在这里插入图片描述
发现已经转成了tensor数据类型

那我们将其数据记录到tensorboard种,进行显示.

import torchvision
from torchvision import transforms
from torch.utils.tensorboard import SummaryWriter
write= SummaryWriter("rgylin_data")
daset_transform= transforms.Compose([transforms.ToTensor()])
trainset = torchvision.datasets.CIFAR10(root='./data',transform=daset_transform,train=True,download=True)
for i in range(15):
    img,index= trainset[i]
    write.add_image("rgylin_data",img,i)
    
write.close()

我们点金add_image看看源码,在这里插入图片描述
发现只能是tensor数据类型,那正好了

import torchvision
from torchvision import transforms
from torch.utils.tensorboard import SummaryWriter
write= SummaryWriter("rgylin_data")
daset_transform= transforms.Compose([transforms.ToTensor()])
trainset = torchvision.datasets.CIFAR10(root='./data',transform=daset_transform,train=True,download=True)
for i in range(15):
    img,index= trainset[i]
    write.add_image("rgylin_data",img,i)

write.close()




tensorboard显示一下,
在这里插入图片描述
控制台输入tensorboard --logdir=C:\Users\ASUS\Desktop\rgylin_data
就可以了
最终得到
在这里插入图片描述

总结

有很多生函数,利用控制台看变量,还有就是看函数的源码注释。官方都给的很详细

  • 4
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值