利用Pytorch搭建卷积神经网络实现图片分类任务（网络模型部分）

最新推荐文章于 2024-05-21 11:50:13 发布

一名不想学习的学渣

最新推荐文章于 2024-05-21 11:50:13 发布

阅读量2k

点赞数 1

分类专栏：神经网络入门文章标签： pytorch cnn 分类卷积神经网络算法

本文链接：https://blog.csdn.net/weixin_44911037/article/details/123209741

版权

神经网络入门专栏收录该内容

11 篇文章 6 订阅

订阅专栏

相信大家学到这，肯定是将神经网络模块学习完了，在利用全连接层进行图片分类的时候，会发现结果并不是非常好，这是为什么？其中第一个原因是，图片需要的参数很多，所以导致维度会很大，参数量也就随之变大。其二，我认为网络并不能很细致的学习图片上的特征，不像卷积块可以来回的去学习图片的特征。

那么卷积神经网络是如何工作的呢？下面用图形给大家展示：

如上图，利用一个3x3的卷积块在图片上进行参数学习，从而能够得到一个卷积特征层，注意：如果是3通道的，那就将每个通道如上图进行计算，然后将数据进行相加，得到的还是一个特征，如果卷积核有多个，那么得到的特征层的通道数就是卷积和的通道数。

下图就是整个卷积神经网络的推理流程：

其中最重要的就是卷积的特征图长和宽变化的大小计算

注意：其中Pad表示填充值，其中填充的方式有两种，其一就是用0在最外层进行填充，其二就是将最外层进行复制再进行填充，这点希望大家了解。

下面试最简单的模型架构部分，对于数据的读取不懂的可以看我上一篇的博客对于Dataset类的重写。

import torch
import torch.nn as nn
class Mynet(nn.Module):
    def __init__(self,in_channels,out_channels,num_class=10):
        super(Mynet, self).__init__()
        self.conv_1=nn.Conv2d(in_channels,out_channels,stride=2,kernel_size=3,padding=1)#stride表示步长#kernel_size表示卷积核大小
        self.batchnormal = nn.BatchNorm2d(out_channels)
        self.conv_2=nn.Conv2d(out_channels,2*out_channels,stride=2,kernel_size=3,padding=1)
        self.relu=nn.ReLU(True)
        self.linear=nn.Linear(50176,num_class)#50176这个数字可以先随意写，然后整体模型代码写完后，再进行运行，会发现报错，
        # 然后将保存下面的维度匹配的值复制后，再将该任意写的值替换就行了
        self.softmax = nn.Softmax(dim=1)
    def forward(self,x):
        #假设输入的通道数为[b,c,w,h],b表示多少个，c表示图片的通道数，w,h分别表示图片的宽高
        b, c, w, h=x.shape
        out=self.conv_1(x)
        out=self.relu(out)
        out=self.batchnormal(out)
        out=self.conv_2(out)
        out=out.view(b,-1)#将卷积层输出的结果进行展平
        out=self.linear(out)
        out=self.softmax(out)
        return out

if __name__ == '__main__':
    a=torch.randn((1,3,224,224))#随机初始化一个图片
    model=Mynet(in_channels=3,out_channels=8)#in_channels表示输入图片的通道数
    out=model(a)
    print(out.shape)

最后希望大家能够学有所成！