利用Pytorch搭建卷积神经网络实现图片分类任务(网络模型部分)

相信大家学到这,肯定是将神经网络模块学习完了,在利用全连接层进行图片分类的时候,会发现结果并不是非常好,这是为什么?其中第一个原因是,图片需要的参数很多,所以导致维度会很大,参数量也就随之变大。其二,我认为网络并不能很细致的学习图片上的特征,不像卷积块可以来回的去学习图片的特征。

那么卷积神经网络是如何工作的呢?下面用图形给大家展示:

 如上图,利用一个3x3的卷积块在图片上进行参数学习,从而能够得到一个卷积特征层,注意:如果是3通道的,那就将每个通道如上图进行计算,然后将数据进行相加,得到的还是一个特征,如果卷积核有多个,那么得到的特征层的通道数就是卷积和的通道数。

 下图就是整个卷积神经网络的推理流程:

 其中最重要的就是卷积的特征图长和宽变化的大小计算

注意:其中Pad表示填充值,其中填充的方式有两种,其一就是用0在最外层进行填充,其二就是将最外层进行复制再进行填充,这点希望大家了解。

下面试最简单的模型架构部分,对于数据的读取不懂的可以看我上一篇的博客对于Dataset类的重写。

import torch
import torch.nn as nn
class Mynet(nn.Module):
    def __init__(self,in_channels,out_channels,num_class=10):
        super(Mynet, self).__init__()
        self.conv_1=nn.Conv2d(in_channels,out_channels,stride=2,kernel_size=3,padding=1)#stride表示步长#kernel_size表示卷积核大小
        self.batchnormal = nn.BatchNorm2d(out_channels)
        self.conv_2=nn.Conv2d(out_channels,2*out_channels,stride=2,kernel_size=3,padding=1)
        self.relu=nn.ReLU(True)
        self.linear=nn.Linear(50176,num_class)#50176这个数字可以先随意写,然后整体模型代码写完后,再进行运行,会发现报错,
        # 然后将保存下面的维度匹配的值复制后,再将该任意写的值替换就行了
        self.softmax = nn.Softmax(dim=1)
    def forward(self,x):
        #假设输入的通道数为[b,c,w,h],b表示多少个,c表示图片的通道数,w,h分别表示图片的宽高
        b, c, w, h=x.shape
        out=self.conv_1(x)
        out=self.relu(out)
        out=self.batchnormal(out)
        out=self.conv_2(out)
        out=out.view(b,-1)#将卷积层输出的结果进行展平
        out=self.linear(out)
        out=self.softmax(out)
        return out

if __name__ == '__main__':
    a=torch.randn((1,3,224,224))#随机初始化一个图片
    model=Mynet(in_channels=3,out_channels=8)#in_channels表示输入图片的通道数
    out=model(a)
    print(out.shape)

最后希望大家能够学有所成!

  • 1
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 利用卷积神经网络对MINST数据集进行分类实验是一种常见和有效的图像识别方法。MINST数据集是一个手写数字图片集合,包括了60000个训练样本和10000个测试样本。 卷积神经网络(Convolutional Neural Network,CNN)是一种模拟人类视觉系统的深度学习模型,其在图像处理和模式识别任务中表现出色。使用CNN对MINST数据集进行分类实验的步骤如下: 1. 数据准备:首先,将MINST数据集加载到程序中,并进行标准化处理,将图像的像素值归一化到0到1之间。 2. 构建CNN模型:这里可以使用Python的深度学习框架,如TensorFlow、Keras或PyTorch来构建CNN模型。定义卷积层、池化层和全连接层,并设置合适的卷积核大小、池化窗口大小和激活函数。 3. 模型训练:将训练集输入到CNN模型中,进行反向传播优化算法,如随机梯度下降(SGD)、Adam或RMSprop来优化模型参数。根据训练集不断调整卷积核权重、偏置和全连接层权重、偏置,直到模型收敛。 4. 模型评估:使用测试集评估已经训练好的模型。将测试集输入到CNN模型中,计算分类准确率、精确度、召回率等指标来评估模型的性能。 5. 结果分析:分析模型在测试集上的性能表现,可以观察混淆矩阵、绘制准确率和损失函数变化曲线等。 通过这样的实验,我们可以了解CNN模型在MINST数据集上的分类效果。MINST数据集是一个较为简单的图像分类任务,对于CNN来说可以很好地处理。这个实验也可以作为学习和理解CNN模型的基础,为后续更复杂的图像分类任务打下基础。 ### 回答2: 卷积神经网络(Convolutional Neural Networks, CNN)是一种深度学习模型,特别适合处理图像数据。下面我将介绍如何使用CNN对MINST手写数字数据集进行分类实验。 MINST数据集是一个包含60000个训练样本和10000个测试样本的手写数字数据集。我们的目标是将这些手写数字图像正确地分类为0至9中的一个。 首先,我们需要导入所需的库和数据集。我们可以使用Python的TensorFlow库来实现卷积神经网络,并使用MINST数据集进行训练和测试。 接下来,我们定义一个CNN模型。一个典型的CNN模型卷积层、池化层和全连接层组成。我们可以通过多次迭代来选择合适的参数和层数。 然后,我们将数据集分为训练集和测试集。训练集用于训练CNN的权重和参数,而测试集用于评估模型的性能。 接下来,我们进行训练和优化。我们使用训练集来训练CNN模型,并通过优化算法来调整权重和参数,以最小化损失函数。 在训练完成后,我们使用测试集来评估模型的性能。我们将模型应用于测试集中的图像,然后计算模型的准确率和损失。 最后,我们可以进行预测。我们可以将新的手写数字图像输入到CNN模型中,然后通过模型的输出确定该图像属于哪个数字类别。 通过上述步骤,我们可以使用CNN对MINST手写数字数据集进行分类实验。这种方法在图像分类问题中已经证明了其有效性,并且在许多实际应用中得到了广泛应用。 ### 回答3: 卷积神经网络(Convolutional Neural Network, CNN)是一种深度学习模型,特别适用于图像处理任务。MINST数据集是一个常用的手写数字识别数据集,由60000个训练样本和10000个测试样本组成。 利用卷积神经网络对MINST数据集进行分类实验的步骤如下: 1. 数据准备:首先需要下载MINST数据集,并将其分为训练集和测试集。MINST数据集提供了每个样本的数字标签和对应的图像数据。 2. 构建模型:使用深度学习框架如TensorFlow或PyTorch搭建一个卷积神经网络模型模型可以包含卷积层、池化层、全连接层等组件。可以选择不同的网络架构和超参数进行实验。 3. 数据预处理:在输入数据之前,进行一些预处理步骤,如将图像数据进行归一化、缩放和平衡处理等。这样可以提高模型的收敛速度和准确性。 4. 训练模型:将准备好的训练集输入模型,使用训练数据进行模型的训练。通过反向传播算法,不断调整模型的权重和偏差,使模型能够更好地拟合训练数据。 5. 测试模型:使用测试集对训练好的模型进行评估。将测试集的图像输入模型,得到输出的预测结果。计算预测结果与真实标签之间的差距,评估模型的准确性。 6. 调优和改进:根据测试结果分析模型的性能,可以进行一些调优和改进,如调整网络架构、增加层数、调整超参数等,以进一步提高模型的准确率。 通过以上步骤,可以利用卷积神经网络对MINST数据集进行分类实验。可以通过测量准确度、损失函数等指标来评估模型的性能。不断优化模型,提高准确率,是卷积神经网络在MINST数据集上进行分类实验的关键。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值