Python实例之CIFAR-10数据集分类

作者介绍

王世豪,男,西安工程大学电子信息学院,2020级硕士研究生,张宏伟人工智能课题组。
研究方向:机器视觉与人工智能。
电子邮件:shauwang@foxmail.com

数据集介绍

CIFAR-10数据集由10个类的60000个32x32彩色图像组成,每个类有6000个图像。有50000个训练图像和10000个测试图像。可点击下载或者从百度云下载。

链接:https://pan.baidu.com/s/1GG0c91T5E92WbJS4bueOzg
提取码:2021

50000个训练图像和10000个测试图像分别分为5个训练批次和1个测试批次,每个批次有10000个图像。
数据集中的10类分别是airplane(飞机),automobile(汽车),bird(鸟),cat(猫),deer(鹿),dog(狗),frog(青蛙),horse(马),ship(船)和truck(卡车),其中没有任何的重叠情况,即airplane只包括飞机,automobile只包括小型汽车,也不会在同一张照片中出现两类事物。以下是来自每个类的10个随机图像:

在这里插入图片描述

代码实现

可更改epoch_num以及其他参数进行测试,运行前注意修改数据集路径为自己下载的数据集路径。

import torchvision #可用来加载数据集
import torch
import torchvision.transforms as transforms #实现图片变换处理
from torch import optim
from torch.autograd  import Variable
import time
# 检验GPU是否可用
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print("训练所用设备", device)

# 定义超参数
epoch_num = 10 # 训练循环次数
batch_size = 100
LR = 0.001 # 学习率

#使用torchvision加载并预处理CIFAR10数据集
transform = transforms.Compose([transforms.ToTensor(),transforms.Normalize(mean = (0.5,0.5,0.5),std = (0.5,0.5,0.5))])#把数据变为tensor并且归一化range [0, 255] -> [0.0,1.0]
trainset = torchvision.datasets.CIFAR10(root='D:/Resource/Datasets/cifar-10-python/',train = True,download=True,transform=transform)
trainloader = torch.utils.data.DataLoader(trainset,batch_size=batch_size,shuffle=True,num_workers=0)
testset = torchvision.datasets.CIFAR10('D:/Resource/Datasets/cifar-10-python/',train=False,download=True,transform=transform)
testloader = torch.utils.data.DataLoader(testset,batch_size=batch_size,shuffle=True,num_workers=0)
classes = ('plane','car','bird','cat','deer','dog','frog','horse','ship','truck')

#定义网络
import torch.nn as nn
import torch.nn.functional as F
class Net(nn.Module):
    def __init__(self):
        super(Net,self).__init__()
        self.conv1 = nn.Conv2d(3,6,5)
        self.conv2 = nn.Conv2d(6,16,5)
        self.fc1 = nn.Linear(16*5*5,120)
        self.fc2 = nn.Linear(120,84)
        self.fc3 = nn.Linear(84,10)
    def forward(self,x):
        x = F.max_pool2d(F.relu(self.conv1(x)),(2,2))
        x = F.max_pool2d(F.relu(self.conv2(x)),2)
        x = x.view(x.size()[0],-1)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return  x

net = Net().to(device)
# print(net)

#定义损失函数和优化器
criterion  = nn.CrossEntropyLoss()#定义交叉熵损失函数
optimizer = optim.SGD(net.parameters(),lr = LR,momentum=0.9)

#训练网络
t0 = time.time()
for epoch in range(epoch_num):
    running_loss = 0.0
    for i, data in enumerate(trainloader, 0):#enumerate将其组成一个索引序列,利用它可以同时获得索引和值,enumerate还可以接收第二个参数,用于指定索引起始值
        train_num = 0
        inputs, labels = data
        inputs, labels = Variable(inputs).to(device), Variable(labels).to(device)
        optimizer.zero_grad()
        outputs = net(inputs)
        loss  = criterion(outputs, labels)
        loss.backward()
        optimizer.step()
        running_loss += loss.item()
        train_num += i
    train_loss = running_loss / train_num
    print('epoch {}  train_loss : {}'.format(epoch+1, train_loss))
print("----------finished training---------")
# 打印训练所花费的时间
t1=time.time()
T=t1-t0
print('The training time took %.2f'%(T)+' s.')
# 对比实际标签与预测标签
dataiter = iter(testloader)
images, labels = dataiter.next()
images, labels = images.to(device), labels.to(device)
print('实际的label: ',' '.join('%08s'%classes[labels[j]] for j in range(4)))
outputs = net(Variable(images))
_, predicted = torch.max(outputs.data,1)#返回最大值和其索引
print('预测结果:',' '.join('%5s'%classes[predicted[j]] for j in range(4)))

# 测试集准确率
correct = 0
total = 0
for data in testloader:
    images, labels = data
    images, labels = images.to(device), labels.to(device)
    outputs = net(Variable(images))
    _, predicted = torch.max(outputs.data, 1)
    total +=labels.size(0)
    correct +=(predicted == labels).sum()
print('10000张测试集中的准确率为: %d %%'%(100*correct/total))

在PyCharm或者Windows的终端下定位到分类程序文件所在文件夹,运行该程序即可进行分类。
分类结果示意如下
在这里插入图片描述
显然只有两层卷积三层全连接的网络学习能力较差,实现数据集分类比较勉强。

Reference

CIFAR-10数据集说明
https://www.cnblogs.com/Jerry-Dong/p/8109938.html
利用卷积神经网络处理CIFAR图像分类
https://zhuanlan.zhihu.com/p/28035475
Pytorch的nn.Conv2d()详解
https://blog.csdn.net/qq_42079689/article/details/102642610
[PyTorch] 基于Python和PyTorch的cifar-10分类
https://blog.csdn.net/qq_41683065/article/details/91368288
PYTHON 中的" %S"%用法
https://www.cnblogs.com/wh-ff-ly520/p/9390855.html

  • 5
    点赞
  • 36
    收藏
    觉得还不错? 一键收藏
  • 77
    评论
PyCharm 是一款非常流行的 Python 集成开发环境(IDE)。而 CIFAR-10 数据集是一个广泛应用于图像识别领域的数据集。下面将介绍如何使用 PyCharm 实现 CIFAR-10 数据集的目标分类实例。 首先,需要下载 CIFAR-10 数据集。可以在官方网站上找到 CIFAR-10 数据集的下载链接,并将其下载到本地。 接下来,在 PyCharm 中创建一个新的 Python 项目。可以在文件菜单中选择“新建项目”,然后设置项目名称和保存路径。 在项目中创建一个 Python 文件,命名为 "cifar10_classification.py"。 然后,需要导入必要的 Python 库,包括 TensorFlow 和 Keras。可以使用以下代码导入这些库: ```python import tensorflow as tf from tensorflow.keras.datasets import cifar10 from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense, Dropout, Flatten from tensorflow.keras.layers import Conv2D, MaxPooling2D from tensorflow.keras import backend as K ``` 接下来,加载 CIFAR-10 数据集,划分为训练集和测试集,并进行预处理。可以使用以下代码实现: ```python # 加载 CIFAR-10 数据集 (x_train, y_train), (x_test, y_test) = cifar10.load_data() # 数据预处理 x_train = x_train.astype('float32') x_test = x_test.astype('float32') x_train /= 255 x_test /= 255 ``` 然后,定义模型架构。可以使用以下代码实现一个简单的卷积神经网络模型: ```python # 定义输入尺寸 input_shape = x_train.shape[1:] # 初始化模型 model = Sequential() # 添加卷积层和池化层 model.add(Conv2D(32, kernel_size=(3, 3), activation='relu', input_shape=input_shape)) model.add(Conv2D(64, (3, 3), activation='relu')) model.add(MaxPooling2D(pool_size=(2, 2))) model.add(Dropout(0.25)) # 添加全连接层 model.add(Flatten()) model.add(Dense(128, activation='relu')) model.add(Dropout(0.5)) model.add(Dense(num_classes, activation='softmax')) ``` 最后,编译和训练模型。可以使用以下代码实现: ```python # 编译模型 model.compile(loss=tf.keras.losses.categorical_crossentropy, optimizer=tf.keras.optimizers.Adadelta(), metrics=['accuracy']) # 训练模型 model.fit(x_train, y_train, batch_size=batch_size, epochs=epochs, verbose=1, validation_data=(x_test, y_test)) # 评估模型 score = model.evaluate(x_test, y_test, verbose=0) print('Test loss:', score[0]) print('Test accuracy:', score[1]) ``` 通过以上步骤,就可以在 PyCharm 中使用 CIFAR-10 数据集实现目标分类实例。记得运行代码并检查输出结果,以确保一切正常运行。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 77
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值