深度学习入门案例：训练一个图像分类器

最新推荐文章于 2023-09-26 10:12:13 发布

一个王二不小

最新推荐文章于 2023-09-26 10:12:13 发布

阅读量1.1k

点赞数 1

本文链接：https://blog.csdn.net/m0_38082373/article/details/108825594

版权

深度学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

1 准备工作

1.1 工具要求

pycharm
安装有pytroch的python38环境
其他必要的第三方包

数据

CIFAR10数据集
包含‘airplane’, ‘automobile’, ‘bird’, ‘cat’, ‘deer’, ‘dog’, ‘frog’, ‘horse’, ‘ship’, ‘truck’等十个类别。

2 快速上手

2.1 基本思路

使用torchvision加载和归一化CIFAR10训练集和测试集
定义一个卷积神经网络
定义损失函数
训练网络
测试网络

2.2 开始操作

2.2.1 加载和归一化数据

在pytorch框架中，可以使用torchbision直接加载CIFAR10数据集。

加载数据

import torch
import torchvision
import torchvision.transforms as transforms

transform = transforms.Compose(
   [transforms.ToTensor(),
    transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))]
)
# 训练集
trainSet = torchvision.datasets.CIFAR10(root='.\\data', train=True, transform=transform, download=True)
# 加载器
trainLoader = torch.utils.data.DataLoader(trainSet, batch_size=4, shuffle=True, num_workers=2)

testSet = torchvision.datasets.CIFAR10(root='.\\data', train=True, transform=transform, download=True)
testLoader = torch.utils.data.DataLoader(trainSet, batch_size=4, shuffle=False, num_workers=2)

classes = ('plane', 'car', 'bird', 'cat',
          'deer', 'dog', 'frog', 'horse', 'ship', 'truck')

展示部分图像标签

    dataiter = iter(trainLoader)
    # print(trainLoader.dataset)
    images, labels = dataiter.next()
    # 展示图像
    im_show(torchvision.utils.make_grid(images))

    # 显示图像标签
    print(' '.join('%5s' % classes[labels[j]] for j in range(4)))

2.2.2 构建一个神经网络

import torch.nn as nn
import torch.nn.functional as F


class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(3, 6, 5)
        self.pool = nn.MaxPool2d(2, 2)
        self.conv2 = nn.Conv2d(6, 16, 5)
        self.fc1 = nn.Linear(16 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        x = x.view(-1, 16 * 5 * 5)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

2.2.3 损失函数

直接使用交叉熵作为损失函数，使用带动量的随机梯度下降。

import torch.optim as optim
import torch.nn as nn

from nnTest.neuralNet import Net

net = Net()
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.9)

2.2.4 训练网络

训练结果
选择的图片：

训练过程：

训练结果：

在随机选取的四张图片中，一张预测错误（只训练了2轮）。

一个王二不小

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
深度学习入门案例：训练一个图像分类器

1 准备工作1.1 工具要求pycharm安装有pytroch的python38环境其他必要的第三方包数据CIFAR10数据集包含‘airplane’, ‘automobile’, ‘bird’, ‘cat’, ‘deer’, ‘dog’, ‘frog’, ‘horse’, ‘ship’, ‘truck’等十个类别。2 快速上手2.1 基本思路使用torchvision加载和归一化CIFAR10训练集和测试集定义一个卷积神经网络定义损失函数训练网络测试网络2.2
复制链接

扫一扫