用残差网络实现MNIST数据集手写数字识别

最新推荐文章于 2024-06-13 16:42:36 发布

同志啊为人民服务！

最新推荐文章于 2024-06-13 16:42:36 发布

阅读量2.3k

点赞数

分类专栏： pytorch 文章标签：残差网络 MNIST 手写数字识别

本文链接：https://blog.csdn.net/t18438605018/article/details/122333343

版权

本文介绍如何利用残差网络实现MNIST数据集的手写数字识别。通过对比传统的CNN结构，阐述残差网络的独特之处，包括其网络结构和残差块的设计。在代码实现部分，使用PyTorch构建网络模型，并在验证集上达到了99%的识别准确率。

摘要由CSDN通过智能技术生成

1.残差网络

本文为用带残差块的CNN网络实现MNIST数据集手写数字的识别。

关于残差网络，知乎上有篇文章讲的不错，供参考：详解残差网络
在这里插入图片描述

残差网络比起LeNet等简单的神经网络，不同之初在于，多了一个连接线。
在这里插入图片描述
左边为基础的CNN结构，右边为带残差的网络结构

残差块是目前网络模型中，一个跟经典、很基础的结构，像DenseNet就是基于残差块来提出的，一个新的网络模型。

在这里插入图片描述
2.MNIST数据集

参考笔者的上篇博客：CNN实现MNIST数据集手写数字识别

3.模型结构
在这里插入图片描述
Residual Block：残差块

其结构为：
在这里插入图片描述
对x做两次卷积后与 x相加，再做激活

4.代码实现（pytorch）

import torch
from torchvision import transforms
from torchvision import datasets
from torch.utils.data import DataLoader
import torch.optim as optim
import torch.nn.functional as F
import matplotlib.pyplot as plt



batch_size = 64

transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.1307),(0.3081)) #两个参数，平均值和标准差

])

train_dataset = datasets.MNIST(
    root="../dataset/mnist/",
    train= True,
    download= True,
    transform= transform
)

train_loader = DataLoader(train_dataset,
                          shuffle = True,
                          batch_size = batch_size)

test_dataset = datasets.MNIST(
    root="../dataset/mnist/",
    train=False,
    download=True,
    transform=transform
)

test_loder = DataLoader(test_dataset,
                        shuffle = True,
                        batch_size = batch_size)


class ResidualBlock(torch.nn.Module):
    def __init__(self, channels):
        super(ResidualBlock, self).__init__()
        self.channels = channels
        self.conv1 = torch.nn.Conv2d(channels, channels, kernel_size=3, padding=1)
        self.conv2 = torch.nn.Conv2d(channels, channels, kernel_size=3, padding=1)

    def forward(self, x):
        y = F.relu(self.conv1(x))
        y = self.conv2(y)
        return F.relu(x + y)

'''
CLASS torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, 
dilation=1, groups=1, bias=True, padding_mode='zeros',

最低0.47元/天解锁文章

同志啊为人民服务！

关注

0
点赞
踩
25

收藏

觉得还不错? 一键收藏
打赏
4
评论
用残差网络实现MNIST数据集手写数字识别

1.残差网络本文为用带残差块的CNN网络实现MNIST数据集手写数字的识别。关于残差网络，知乎上有篇文章讲的不错，供参考：详解残差网络残差网络比起LeNet等简单的神经网络，不同之初在于，多了一个连接线。左边为基础的CNN结构，右边为带残差的网络结构残差块是目前网络模型中，一个跟经典、很基础的结构，像DenseNet就是基于残差块来提出的，一个新的网络模型。2.MNIST数据集参考笔者的上篇博客：CNN实现MNIST数据集手写数字识别3.模型结构Residual Block：残差块
复制链接

扫一扫