用pytorch对mnist数据集进行分类

最新推荐文章于 2024-06-03 19:26:35 发布

windawdaysss

最新推荐文章于 2024-06-03 19:26:35 发布

阅读量2.9k

点赞数 3

分类专栏： pytorch 文章标签：深度学习 pytorch 神经网络

本文链接：https://blog.csdn.net/weixin_40356612/article/details/106051137

版权

pytorch 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

pytorch对MNIST手写数字进行识别

本文为使用pytorch对MNIST手写字体数据集进行识别分类

数据下载：

pytorch已提供了完整的MNIST数据集供我们下载，具体实现代码如下

import torch 
from torch.utils.data import DataLoader
import torchvision.datasets as dsets 
import torchvision.transforms as transforms

batch_size = 100
# MNIST dataset
train_dataset = dsets.MNIST(root='./pymnist', train=True, transform=transforms.ToTensor(), download=True)
test_dataset = dsets.MNIST(root='./pymnist', train=False, transform=transforms.ToTensor(), download=True)
# load_data
train_loader = DataLoader(dataset=train_dataset, batch_size=batch_size, shuffle=True)
test_loader = DataLoader(dataset=test_dataset, batch_size=batch_size, shuffle=True)

打印原始数据和数据打乱按批次读取的数据：

# original_data
print("train_data:", train_dataset.train_data.size())
print("train_labels:", train_dataset.train_labels.size())
print("test_data:", test_dataset.test_data.size())
print("test_labels:", test_dataset.test_labels.size())
# shuffle batch_size data
print("batch_size:", train_loader.batch_size)
print("load_train_data:", train_loader.dataset.train_data.shape)
print("load_train_labels:", train_loader.dataset.train_labels.shape)

打印的结果如下图所示：
在这里插入图片描述

定义神经网络：

input_size = 784
hidden_size = 500
num_classes = 10

# #定义神经网络模型
class Neural_net(nn.Module):
    def __init__(self, input_num, hidden_size, output_num):
        super(Neural_net, self).__init__()
        self.layers1 = nn.Linear(input_num, hidden_size)
        self.layers2 = nn.Linear(hidden_size, output_num)

    def forward(self, x):
        out = self.layers1(x)
        out = torch.relu(out)
        out = self.layers2(out)
        return out
net = Neural_net(input_size, hidden_size, num_classes)
print(net)

自定义神经网络在pytorch中需要继承Module，以上打印的输出结果为：
在这里插入图片描述

训练：

# training
learning_rate = 1e-1
num_epoches = 5
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.SGD(net.parameters(), lr=learning_rate)
for epoch in range(num_epoches):
    print("current epoch = {}".format(epoch))
    for i, (images,labels) in enumerate(train_loader):
        images = Variable(images.view(-1, 28*28))
        labels = Variable(labels)

        outputs = net(images)
        loss = criterion(outputs, labels)  # calculate loss
        optimizer.zero_grad()  # clear net state before backward
        loss.backward()       
        optimizer.step()   # update parameters

        if i%100 == 0:
            print("current loss = %.5f" %loss.item())
print("finished training")

测试准确度：

# prediction
total = 0
correct = 0
for images, labels in test_loader:
    images = Variable(images.view(-1, 28*28))
    labels = Variable(labels)
    outputs = net(images)

    _,predicts = torch.max(outputs.data, 1)
    total += labels.size(0)
    correct += (predicts == labels).sum()
print("Accuracy = %.2f" %(100*correct/total))

运行结果，打印出的准确率为96%

参考文献

《深度学习与图像识别原理与实践》魏溪含涂铭张修鹏著，机械工业出版社，2019.6 p122-125

windawdaysss

关注

3
点赞
踩
23

收藏

觉得还不错? 一键收藏
3
评论
用pytorch对mnist数据集进行分类

#本文为使用pytorch对MNIST手写字体数据集进行识别分类##数据下载：pytorch已提供了完整的MNIST数据集供我们下载，具体实现代码如下import torch from torch.utils.data import DataLoaderimport torchvision.datasets as dsets import torchvision.transforms as transformsbatch_size = 100# MNIST datasettrain_da
复制链接

扫一扫

专栏目录