pytorch 预测手写体数字_Pytorch实战（一）——MNIST手写数字识别

最新推荐文章于 2023-03-17 08:22:38 发布

weixin_39767513

最新推荐文章于 2023-03-17 08:22:38 发布

阅读量856

点赞数

文章标签： pytorch 预测手写体数字

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39767513/article/details/111980640

版权

MNIST手写数字识别项目因为数据量小、识别任务简单而成为图像识别入门的第一课，MNIST手写数字识别项目有如下特点：

识别难度低，即使把图片展开为一维数据，且只使用全连接层也能获得超过98%的识别准确度；

计算量小，不需要GPU加速也可以快速训练完成；

数据易得，教程易得。

本文中的数据来源于Kaggle网站，并非Pytorch自带的数据集(个人认为使用Pytorch封装好的MNIST数据集不利于入门)。接下来我们展示不同思路下的MNIST识别结果。

1. 将MNIST视为回归问题和分类问题的差别

一般来说，我们认为MNIST是一个图像分类问题，而非回归问题，因为图像的特征并没有随着0-9数字增大而显现出的对应的特征值变化关系，即图像中的像素值与数字没有表现出相关关系。

全连接回归模式(使用MSELoss)准确率：

全连接回归网络

排行榜上清一色的0.9以上，这个成绩真的拿不出手啊。

全连接分类模式(使用CrossEntropy)准确率：

全连接分类模式——两次迭代

全连接分类模式——两百次迭代

使用分类模式，仅需两次迭代就能达到0.93的准确率，并且200次迭代之后，准确率达到了0.97。

2. 卷积神经网络

将图片一维展开尚且能达到0.97的准确率，如果让图片保持原状，使用卷积神经网络来识别能够得到什么结果呢。

卷积神经网络准确率：

卷积神经网络准确率

项目包含两个py文件，mnist_models.py和main.py，下面是mnist_models.py中的源代码：

import torch as t

def to_image(data):

data = data.view(-1,1,28,28)

return data

class fc_net(t.nn.Module):

'''

全连接网络

'''

def __init__(self):

super(fc_net,self).__init__()

self.fc1 = t.nn.Sequential(t.nn.Linear(784,200),t.nn.ReLU())

self.fc2 = t.nn.Sequential(t.nn.Linear(200,100),t.nn.ReLU())

self.fc3 = t.nn.Sequential(t.nn.Linear(100,20),t.nn.ReLU())

self.fc4 = t.nn.Linear(20,10)

def forward(self,x):

x = self.fc1(x)

x = self.fc2(x)

x = self.fc3(x)

x = self.fc4(x)

return x

class conv_net(t.nn.Module):

'''

卷积网络，需先将数据转为2维图片形式

'''

def __init__(s

最低0.47元/天解锁文章

weixin_39767513

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
pytorch 预测手写体数字_Pytorch实战（一）——MNIST手写数字识别

MNIST手写数字识别项目因为数据量小、识别任务简单而成为图像识别入门的第一课，MNIST手写数字识别项目有如下特点：识别难度低，即使把图片展开为一维数据，且只使用全连接层也能获得超过98%的识别准确度；计算量小，不需要GPU加速也可以快速训练完成；数据易得，教程易得。本文中的数据来源于Kaggle网站，并非Pytorch自带的数据集(个人认为使用Pytorch封装好的MNIST数据集不利于入门)...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。