小土堆Pytorch笔记P14、15

编程基础很弱,需要机器学习,学习记录,按自己理解写的,希望以后能学懂吧,要是有大神看到还请赐教。

torchvision中的数据集使用

dataset和transforms联合使用

首先,怎么下载给定的数据集CIFAR10。

实际是先下载一个压缩文件,然后对压缩文件进行一个解压。

import torchvision

cifar_path = "D:\\Scientific_Research\\Pycharmproject\\Biji\\dataset"
train_set = torchvision.datasets.CIFAR10(root=cifar_path, train=True, download=True)
test_set = torchvision.datasets.CIFAR10(root=cifar_path, train=False, download=True)

# 查看下载数据集
print(test_set[0])  # 运行会发现和前面课程中dataset那种式的,是一个元组。
# 使用Debug看看啥样
# 不太会这里就接着往下边写
print(test_set.classes)  # 运行查看是一个列表,里面是数据集中的图片标签。
# 既然是元组,可以使用这样的方法来赋值。
img, target = test_set[0]
print(img)
print(target)
# 发现target为3而非具体类别
print(test_set.classes[3])  # 运行发现3对应‘cat’

CIFAR10数据集简介:

包含6w张32*32的彩色图,共分为10个类别,每个类别6k张图像。5w张图像为训练图,1w为测试图。 

由于CIFAR10中的图片为PIL,在Pytorch使用需要转化为tensor数据类型。因此需要与transforms联合使用。

import torchvision
# 联合transforms使用。
dataset_transform = torchvision.transforms.Compose([
    torchvision.transforms.ToTensor()
])
# 接下来更改通过设置transform进行联合加载数据集
cifar_path = "D:\\Scientific_Research\\Pycharmproject\\Biji\\dataset"
train_set = torchvision.datasets.CIFAR10(root=cifar_path, train=True, download=True,transform=dataset_transform)
test_set = torchvision.datasets.CIFAR10(root=cifar_path, train=False, download=True,transform=dataset_transform)

# 再看看数据集是什么类型
print(type(test_set[0]))

# 既然是tensor就可以放入tensorboard,复习一下。

from torch.utils.tensorboard import SummaryWriter

writer = SummaryWriter("logs")
for i in range(10):
    img, target = test_set[i]
    writer.add_image("CIFAR10数据集", img, i)
writer.close()

DataLoader的使用

dataset相当于扑克牌,dataloader从dataset中取数据到神经网络中,相当于抓牌。

DataLoader的一些参数:

batch_size:一次抓几张牌。

shuffle:是否打乱顺序,重新洗牌。

number_workers:加载数据选择多少个进程。

drop_last:当有余下的牌时是否舍去。

# 看 CIFAR10中数据集返回的是啥,Ctrl左键CIFAR10看帮助,里边__getitem__返回的是啥。

# DataLoader
import torchvision
from torch.utils.data import DataLoader

cifar_path = "D:\\Scientific_Research\\Pycharmproject\\Biji\\dataset"
test_data = torchvision.datasets.CIFAR10(root=cifar_path, train=False, transform=torchvision.transforms.ToTensor(),
                                         download=True)
# 加载测试集
test_loader = DataLoader(dataset=test_data, batch_size=4, shuffle=True, num_workers=0, drop_last=False)

# 查看测试数据集第一张图片及target
img, target = test_data[0]
print(img.shape)
print(target)

# 此处batch_size=4 指取0123 并进行打包,返回imgs和targets。
# 那么怎么取出test_loader中的返回呢
for data in test_loader:
    imgs,targets=data
    print(imgs.shape)
    print(targets)

接下来讲解了取样Sample及batch64输入tensorboard循环,代码如下: 

import torchvision
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

cifar_path = "D:\\Scientific_Research\\Pycharmproject\\Biji\\dataset"
test_data = torchvision.datasets.CIFAR10(root=cifar_path, train=False, transform=torchvision.transforms.ToTensor(),
                                         download=True)
test_loader = DataLoader(dataset=test_data, batch_size=64, shuffle=True, num_workers=0, drop_last=False)
step = 0
for data in test_loader:
    imgs, targets = data
    writer = SummaryWriter("logs")
    writer.add_images("batch64", imgs, step)
    step += 1

分两轮选取数据,并演示shuffle为True或False的区别,代码如下:

import torchvision
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

cifar_path = "D:\\Scientific_Research\\Pycharmproject\\Biji\\dataset"
test_data = torchvision.datasets.CIFAR10(root=cifar_path, train=False, transform=torchvision.transforms.ToTensor(),
                                         download=True)
test_loader = DataLoader(dataset=test_data, batch_size=64, shuffle=True, num_workers=0, drop_last=False)
for i in range(2):
    step = 0
    for data in test_loader:
        imgs, targets = data
        writer = SummaryWriter("logs")
        writer.add_images("batch64{}".format(i), imgs, step)
        step += 1

可以看到,当shuffle为True时,两次循环选取图片不一样。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值