PyTorch入门：以MNIST手写数字识别为例

最新推荐文章于 2024-10-18 21:44:50 发布

逸巽散人

最新推荐文章于 2024-10-18 21:44:50 发布

阅读量417

点赞数 8

分类专栏：深度学习文章标签： pytorch 人工智能 python

本文链接：https://blog.csdn.net/weixin_42039453/article/details/140492744

版权

深度学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

PyTorch入门：以MNIST手写数字识别为例

引言

在人工智能和深度学习的世界里，PyTorch已经成为最受欢迎的框架之一。它不仅强大灵活，而且易于学习和使用。今天，我们将通过一个经典的机器学习问题——MNIST手写数字识别，来入门PyTorch。无论你是深度学习新手，还是希望迁移到PyTorch的开发者，这篇文章都将为你提供一个良好的起点。

PyTorch简介

PyTorch是由Facebook的AI研究团队开发的开源机器学习库。它以其动态计算图和直观的Python式语法而闻名。与其他框架相比，PyTorch的学习曲线相对平缓，这使得它成为初学者的理想选择。

MNIST数据集

MNIST是机器学习领域最著名的数据集之一。它包含70,000张28x28像素的手写数字图像，其中60,000张用于训练，10,000张用于测试。我们的目标是训练一个模型，能够准确识别这些手写数字。

开始使用PyTorch

1. 安装PyTorch

首先，我们需要安装PyTorch。可以使用pip命令进行安装：

pip install torch torchvision

2. 导入必要的库

import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms

3. 加载MNIST数据集

PyTorch提供了方便的工具来加载MNIST数据集：

transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,))])

trainset = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=64, shuffle=True)

testset = torchvision.datasets.MNIST(root='./data', train=False, download=True, transform=transform)
testloader = torch.utils.data.DataLoader(testset, batch_size=64, shuffle=False)

4. 定义神经网络模型

我们将创建一个简单的全连接神经网络：

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.fc1 = nn.Linear(28 * 28, 128)
        self.fc2 = nn.Linear(128, 64)
        self.fc3 = nn.Linear(64, 10)

    def forward(self, x):
        x = x.view(-1, 28 * 28)
        x = torch.relu(self.fc1(x))
        x = torch.relu(self.fc2(x))
        x = self.fc3(x)
        return x

model = Net()

5. 定义损失函数和优化器

criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.9)

6. 训练模型

for epoch in range(5):  # 训练5个epoch
    running_loss = 0.0
    for i, data in enumerate(trainloader, 0):
        inputs, labels = data
        optimizer.zero_grad()
        outputs = model(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()
        running_loss += loss.item()
    print(f'Epoch {epoch + 1}, Loss: {running_loss / len(trainloader)}')

7. 测试模型

correct = 0
total = 0
with torch.no_grad():
    for data in testloader:
        images, labels = data
        outputs = model(images)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

print(f'准确率: {100 * correct / total}%')