PyTorch使用CNN对手写数字进行识别

herosunly

已于 2022-03-08 21:11:42 修改

阅读量1.2w

点赞数 18

分类专栏：机器学习入门之工具篇文章标签： pytorch

于 2019-04-17 12:21:06 首次发布

本文链接：https://blog.csdn.net/herosunly/article/details/89352664

版权

机器学习入门之工具篇专栏收录该内容

83 篇文章 201 订阅 ¥49.90 ¥99.00

订阅专栏

文章目录

1. 准备工作
2. 构建CNN网络
3.训练模型
4.模型评估
5. torch.nn.Conv2d简介

MNIST数据集是学习各种神经网络的开胃菜。它的任务是识别手写数字（1~9），具体介绍官网http://yann.lecun.com/exdb/mnist/。这次我们用MNIST来小试牛刀。上次我们采用的是MLP网络，这次使用CNN网络。

1. 准备工作

1.1 导包和设置随机种子

import torchvision
import torchvision.datasets as datasets #为了下一步加载数据
import torch
import torch.nn as nn
import torch.

了解本专栏

订阅专栏解锁全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

herosunly

关注关注

18
点赞
踩
12

收藏

觉得还不错? 一键收藏
打赏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

订阅专栏

使用CNN实现对手写数字的识别(Pytorch).zip

07-01

手写数字识别

Cursor.moveToNext()

qq_64628470的博客

04-05

1294

Android在查询数据的操作时对代码Cursor对象的遍历逐个取出数据有以下两种方法。为啥第一种是先输出第一个值再移动游标，而第二种是先移动游标再输出。

2 条评论您还未登录，请先登录后发表或查看评论

Cursor.moveToNext();和Cursor.moveToFirst();

一条咸鱼

02-20

1万+

源码： if(spGoodsCursor.moveToFirst()){ //修改为 moveToNext() 后不报错 // //获取特价商品的特殊价格： float spPrice = Float.parseFloat( spGoodsCursor.getString(spGoodsCursor.getColumnIndex("fPrice_SO

PyTorch--卷积神经网络（CNN）模型实现手写数字识别

wumingzei的博客

08-14

1495

今天要介绍的这段代码是一个使用PyTorch框架实现的卷积神经网络（CNN）模型，用于对MNIST数据集进行分类的示例。MNIST数据集是手写数字识别领域的一个标准数据集，包含0到9的灰度图像。导入必要的库：导入PyTorch、PyTorch神经网络模块、torchvision（用于处理图像数据集）和transforms（用于图像预处理）。设备配置：设置模型运行的设备，优先使用GPU（如果可用），否则使用CPU。超参数设置：定义了训练迭代的轮数(num_epochs)、类别数()、批次大小(

android文件夹cusr,android cursor.moveToNext()?

weixin_28686771的博客

05-29

335

可以将文章内容翻译成中文,广告屏蔽插件可能会导致该功能失效(如失效，请关闭广告屏蔽插件后再试):问题:I am trying to query all the columns in a table into one long text view and/or string. I know this might not be the right way to do things but I have...

Android中的Cursor

weixin_47323733的博客

01-15

4562

Cursor 1. 什么是Cursor Cursor就是游标，可以理解为我们在输入文本框闪烁的光标，标记我们要输入的位置。那什么是光标呢这个一闪一闪的竖线就是光标。而我们的Cursor也是用来标记位置，标记我们要读取数据的位置。 2. Cursor对象获取我们这里用内容提供者进行举例。 //指定获取字段 String[] columns = new String[]{MediaStore.Files.FileColumns._ID, MediaStore.Files.FileColu

Cursor.moveToFirst()和Cursor.moveToNext()的疑惑

leo的博客

08-08

8437

在学习android内容提供器时，在查询数据的操作时对代码Cursor对象的遍历逐个取出数据有些疑惑。有些遍历是采用如下方法一： if(cursor.moveToFirst()){ do{ //取出数据 } while(cursor.moveToNext()); } 有些遍历则是采取如下方法二： if(cusor!=null){ while(cursor.moveToNex...

基于pytorch实现的MNIST+CNN模型实现对手写数字的识别代码+报告.zip

12-26

本次实验在pytorch的框架上搭建了MNIST手写数字识别的卷积神经网络，深刻理解了卷积过程的几何含义（比如padding和stride对输出size的影响，比如kernel对特征的影响等），也完成了CNN模型的搭建，有了非常好的实验...

基于pytorch实现的MNIST+CNN模型实现对手写数字的识别（源码+数据集+文档）

最新发布

09-03

基于pytorch实现的MNIST+CNN模型实现对手写数字的识别（源码+数据集+文档），含有代码注释，新手也可看懂，个人手打98分项目，导师非常认可的高分项目，毕业设计、期末大作业和课程设计高分必看，下载下来，简单部署...

基于pytorch实现的MNIST+CNN模型实现对手写数字的识别源码+数据集（高分项目）

09-03

基于pytorch实现的MNIST+CNN模型实现对手写数字的识别源码+数据集（高分项目），含有代码注释，新手也可看懂，个人手打98分项目，导师非常认可的高分项目，毕业设计、期末大作业和课程设计高分必看，下载下来，简单...

基于pytorch实现的MNIST+CNN模型实现对手写数字的识别（源码+数据集+报告）.zip

01-13

基于PyTorch的MNIST+CNN模型可用于对手写数字进行识别。下面是一种实现该模型的步骤： 1. 数据准备：下载MNIST数据集，它包含了大量的手写数字图像和对应的标签。使用PyTorch的torchvision库可以方便地加载和预处理...

cursor 的moveToFirst和moveToNext和moveToPrevious以及moveToLast

huanongjingchao的专栏

03-30

1万+

查询出来的cursor的初始位置是指向第一条记录的前一个位置的，cursor.moveToFirst（）指向查询结果的第一个位置。一般通过判断cursor.moveToFirst()的值为true或false来确定查询结果是否为空。cursor.moveToNext()是用来做循环的，一般这样来用：while(cursor.moveToNext()){ } cursor.moveToPrevio

Android中Cursor类总结-概念和用法

到达的专栏

08-09

988

Cursor是把查询到的结果集封装在一个Cursor对象当中。 cursor就像是结果集上的一个游标，可以向前向后移动。取出Cursor中的数据一般是用： while(cursor.moveToNext()) { // 取值 } 很多时候，不要忘记 moveT

CNN实现手写数字识别（Pytorch）

weixin_46599926的博客

05-04

1万+

CNN（卷积神经网络）主要包括卷积层、池化层和全连接层。输入数据经过多个卷积层和池化层提取图片信息后，最后经过若干个全连接层获得最终的输出。以下基于Pytorch框架搭建一个CNN神经网络实现手写数字识别。

Android数据库操作----Cursor

weixin_42312087的博客

10-24

2461

Cursor 游标 Android使用的数据库是SQLite数据库，对于数据库记录的操作，可以使用Cursor来进行。 Cursor (1)是每行的集合；(2)使用moveToFirst()定位第一行；(3)必须知道每一列的名称；(4)必须知道每一列的数据类型；(5)是一个随机的数据源；(6)所有的数据都是通过下标取得；(7)Cursor位于android.database.Cursor类，可见它的设计是基于数据库服务产生的；(8)在Android查询数据是通过Cursor类来实现的。当我们使用S..

tensorflow学习之（十）使用卷积神经网络（CNN）分类手写数字0-9

09-05

382

#卷积神经网络cnn import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data #数据包,如果没有自动下载 number 1 to 10 data mnist = input_data.read_data_sets('MNIST_data',one_hot=True) ...

STM32 UDP部分，基于ENC28J60以太网模块，项目笔记

小灰灰的博客

08-28

7989

1.前言嵌入式以太网开发是一个很有挑战性的工作。通过几个月的学习，我个人觉得大致有两条途径。第一条途径，先通过高级语言熟悉socket编程，例如C#或C++，对bind，listen，connect，accept等函数熟悉之后，应用 lwIP。第二种途径，通过分析嵌入式以太网代码，结合TCPIP协议栈规范逐步实践代码。第一种途径效率高，开发周期短，编写出来的代码性能稳定，第二种途径花的时间长，...

STM32玩转物联网实战篇：4.Mqtt通信详解（从通信原理到报文组包再到通信实战）

热门推荐

qq_42523645的博客

04-15

2万+

Mqtt协议介绍 MQTT是机器对机器(M2M)/物联网(IoT)连接协议。它被设计为一个极其轻量级的发布/订阅消息传输协议。对于需要较小代码占用空间和/或网络带宽非常宝贵的远程连接非常有用，是专为受限设备和低带宽、高延迟或不可靠的网络而设计。MQTT是一个客户端-服务端架构的发布/订阅模式的消息传输协议。它的设计思想是轻巧、开放、简单、规范，易于实现。这些特点使得它对很多场景来说都是很好的选择，特别是对于受限的环境如机器与机器的通信（M2M）以及物联网环境（IoT）。 ...

Cursor的moveToFirst和moveToNext

chenjinyu的专栏

07-06

2万+

ContentResolver cr = getContentResolver(); Cursor cursor =cr.query(ContactsContract.Contacts.CONTENT_URI, null, null, null,null); cursor.mov

使用pytorch搭建卷积神经网络识别手写数字

06-28

### 回答1：使用PyTorch搭建卷积神经网络可以很容易地实现手写数字识别。首先需要导入PyTorch库，并加载手写数字数据集。然后，可以定义卷积神经网络的结构，包括卷积层、池化层、全连接层等。接着，可以定义损失函数和优化器，并进行模型训练。最后，可以使用测试集对模型进行评估。整个过程需要注意超参数的选择和调整，以达到最佳的识别效果。 ### 回答2： Pytorch是一个非常流行的深度学习框架，它的设计目的是为了能够快速地搭建神经网络模型，并进行训练和测试。本文将介绍如何使用Pytorch搭建卷积神经网络来对手写数字进行识别。首先，我们需要准备手写数字数据集，其中包含许多手写数字图片和其对应的标签。这里我们可以使用MNIST数据集，它是一个非常著名的手写数字识别数据集，包含60000张训练图片和10000张测试图片。Pytorch已经内置了该数据集。接着，我们需要构建卷积神经网络模型。对于手写数字识别任务，我们可以采用经典的LeNet-5模型，它是一个两层卷积层和三层全连接层的模型。在Pytorch中，我们可以使用nn.Module类来定义模型。模型定义如下： ``` import torch.nn as nn class LeNet(nn.Module): def __init__(self): super(LeNet, self).__init__() self.conv1 = nn.Conv2d(1, 6, 5) self.pool1 = nn.MaxPool2d(2) self.conv2 = nn.Conv2d(6, 16, 5) self.pool2 = nn.MaxPool2d(2) self.fc1 = nn.Linear(16 * 4 * 4, 120) self.fc2 = nn.Linear(120, 84) self.fc3 = nn.Linear(84, 10) def forward(self, x): x = self.conv1(x) x = nn.functional.relu(x) x = self.pool1(x) x = self.conv2(x) x = nn.functional.relu(x) x = self.pool2(x) x = x.view(-1, 16 * 4 * 4) x = self.fc1(x) x = nn.functional.relu(x) x = self.fc2(x) x = nn.functional.relu(x) x = self.fc3(x) return x ``` 上述代码定义了一个名为LeNet的模型，该模型由两个卷积层、两个最大池化层和三个全连接层组成，并且采用ReLU作为激活函数。接下来，我们需要定义损失函数和优化器。在这里，我们将采用交叉熵作为损失函数，优化器使用随机梯度下降（SGD）。 ``` criterion = nn.CrossEntropyLoss() optimizer = torch.optim.SGD(lenet.parameters(), lr=0.001, momentum=0.9) ``` 最后，我们需要定义一些训练和测试的函数，并开始训练模型。 ``` def train(model, dataloader, criterion, optimizer): model.train() running_loss = 0.0 correct = 0 total = 0 for i, data in enumerate(dataloader): inputs, labels = data optimizer.zero_grad() outputs = model(inputs) loss = criterion(outputs, labels) loss.backward() optimizer.step() running_loss += loss.item() _, predicted = \ torch.max(outputs.data, dim=1) total += labels.size(0) correct += \ (predicted == labels).sum().item() epoch_loss = running_loss / len(dataloader.dataset) epoch_acc = correct / total return epoch_loss, epoch_acc def test(model, dataloader, criterion): model.eval() running_loss = 0.0 correct = 0 total = 0 with torch.no_grad(): for data in dataloader: inputs, labels = data outputs = model(inputs) loss = criterion(outputs, labels) running_loss += loss.item() _, predicted = \ torch.max(outputs.data, dim=1) total += labels.size(0) correct += \ (predicted == labels).sum().item() epoch_loss = running_loss / len(dataloader.dataset) epoch_acc = correct / total return epoch_loss, epoch_acc for epoch in range(num_epochs): train_loss, train_acc = \ train(lenet, train_dataloader, criterion, optimizer) valid_loss, valid_acc = \ test(lenet, valid_dataloader, criterion) print(f"Epoch {epoch + 1}: ") print(f"Train Loss={train_loss:.4f}, Train Acc={train_acc:.4f}") print(f"Valid Loss={valid_loss:.4f}, Valid Acc={valid_acc:.4f}") ``` 此时，我们的模型已经成功训练好了，可以使用测试集进行测试了。测试代码如下： ``` test_loss, test_acc = \ test(lenet, test_dataloader, criterion) print(f"Test Loss={test_loss:.4f}, Test Acc={test_acc:.4f}") ``` 在完成测试后，可以使用以下语句保存该模型： ``` torch.save(lenet.state_dict(), "lenet.pth") ``` 上述代码将保存模型的权重参数到文件lenet.pth中。最后，我们可以使用以下代码加载该模型并对样本进行识别： ``` lenet.load_state_dict(torch.load("lenet.pth")) lenet.eval() sample, _ = test_dataset[0] outputs = lenet(torch.unsqueeze(sample, dim=0)) _, predicted = \ torch.max(outputs.data, dim=1) print(f"Predicted Label: {predicted.item()}") ``` 这段代码将加载保存的模型权重，并使用该模型识别测试集中第一张图片的标签。 ### 回答3：使用pytorch搭建卷积神经网络（Convolutional Neural Network, CNN）识别手写数字，下面是详细步骤： 1. 数据集准备使用MNIST手写数字数据集，该数据集由60,000个训练图像和10,000个测试图像组成。在pytorch中可以使用torchvision.datasets.MNIST()加载该数据集。 2. 构建CNN模型使用pytorch的nn.Module来定义CNN模型，其中包括卷积层、ReLU激活函数、池化层以及全连接层等。 3. 定义损失函数和优化器定义交叉熵损失函数（CrossEntropyLoss）和随机梯度下降优化器（SGD，Stochastic Gradient Descent）。 4. 训练模型使用dataloader来加载数据集，对模型进行训练，可以使用epoch的方式进行多次训练。 5. 评估模型在测试集上进行预测，并计算准确率等指标，评估模型的性能。下面是一份pytorch代码示例： ```python import torch import torch.nn as nn import torch.optim as optim import torchvision.datasets as datasets import torchvision.transforms as transforms # 加载MNIST数据集 transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.1307,), (0.3081,))]) train_dataset = datasets.MNIST(root='./data', train=True, download=True, transform=transform) test_dataset = datasets.MNIST(root='./data', train=False, download=True, transform=transform) batch_size = 32 train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=batch_size, shuffle=True) test_loader = torch.utils.data.DataLoader(test_dataset, batch_size=batch_size, shuffle=True) # 构建CNN模型 class CNN(nn.Module): def __init__(self): super(CNN, self).__init__() self.conv1 = nn.Conv2d(in_channels=1, out_channels=32, kernel_size=5, stride=1, padding=2) self.relu1 = nn.ReLU() self.pool1 = nn.MaxPool2d(kernel_size=2, stride=2) self.conv2 = nn.Conv2d(in_channels=32, out_channels=64, kernel_size=5, stride=1, padding=2) self.relu2 = nn.ReLU() self.pool2 = nn.MaxPool2d(kernel_size=2, stride=2) self.fc1 = nn.Linear(7 * 7 * 64, 1024) self.relu3 = nn.ReLU() self.fc2 = nn.Linear(1024, 10) def forward(self, x): x = self.conv1(x) x = self.relu1(x) x = self.pool1(x) x = self.conv2(x) x = self.relu2(x) x = self.pool2(x) x = x.view(x.size(0), -1) x = self.fc1(x) x = self.relu3(x) x = self.fc2(x) return x model = CNN() print(model) # 定义损失函数和优化器 criterion = nn.CrossEntropyLoss() optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.9) # 训练模型 num_epochs = 10 for epoch in range(num_epochs): for i, (images, labels) in enumerate(train_loader): optimizer.zero_grad() outputs = model(images) loss = criterion(outputs, labels) loss.backward() optimizer.step() if (i+1) % 100 == 0: print('Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}' .format(epoch+1, num_epochs, i+1, len(train_loader), loss.item())) # 评估模型 model.eval() with torch.no_grad(): correct = 0 total = 0 for images, labels in test_loader: outputs = model(images) _, predicted = torch.max(outputs.data, 1) total += labels.size(0) correct += (predicted == labels).sum().item() print('Accuracy of the network on the 10000 test images: {} %'.format(100 * correct / total)) ``` 通过训练和评估，我们可以得到一个准确率较高的手写数字识别CNN模型。