基于数据集CIFAR-10,利用卷积神经网络进行分类。
1.CIFAR-10数据集
1.1概念
由10个类的6w个32x32彩色图像组成,每个类由6k个图像。5w个训练图,1W测试图。
分为5个训练批次,1个测试批次,每个批次有1w个图像。测试批次每个类恰好1k张随机图像。训练批次随机顺序包含剩余图像,总之,5个训练集之和包含每个类的5k张。
多分类单标签
1.2组成
data ——一个10000x3072个uint8s的numpy数组。数组的每一行存储一个32x32的彩色图像。前1024个条目包含红色通道值,下一个1024个条目为绿色,最后1024个条目为蓝色。图像按行的主要顺序存储,因此数组的前32个条目是图像第一行的红色通道值。
labels——范围为0-9的10000个数字的列表。索引i处的数字表示数组数据中第i个图像的标签。
该文件包含另一个称为数据集的文件批处理.meta. 它也包含一个Python字典对象。它包含以下条目:
label_names——一个10个元素的列表,为上面描述的labels数组中的数字标签提供有意义的名称。例如,label_names[0]=“飞机”,label_names[1]=“汽车”,等等。
2.代码
2.1数据记载、预处理和可视化
import os
os.environ['KMP_DUPLICATE_LIB_OK'] = 'True'
import torch
import torchvision
import torchvision.transforms as transforms
#下载数据预处理
transform=transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.5,0.5,0.5),(0.5,0.5,0.5))])
trainset=torchvision.datasets.CIFAR10(root='./data',train=True,download=True,transform=transform )
trainloader=torch.utils.data.DataLoader(trainset,batch_size=4,shuffle=True,num_workers=2)
testset=torchvision.datasets.CIFAR10(root='./data',train=False,download=False,transform=transform )
testloader=torch.utils.data.DataLoader(testset,batch_size=4,shuffle=False)
classes=('plane','car','bird','cat','deer','dog','frog','horse','ship','truck')#10个类
#可视化
import matplotlib