第八章卷积神经网络CNN

ModelBulider

已于 2024-08-20 19:09:27 修改

阅读量1.1k

点赞数 25

分类专栏： PyTorch 文章标签： cnn 人工智能神经网络深度学习 pytorch

于 2024-08-20 08:00:00 首次发布

本文链接：https://blog.csdn.net/weixin_44063529/article/details/141287697

版权

PyTorch 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

一、卷积神经网络

1.1 图片的数据格式

通常是3通道的RGB图
在这里插入图片描述

由于全连接层处理图片这种数据量较大的数据时，会需要学习到很大的参数，考虑到计算机硬件的配置，应该使用卷积处理

1.2 卷积原理

创建卷积核，使其作为输入的共享权重，执行卷积操作，以此减少参数量
卷积操作
卷积操作考虑的是局部的输入数值
信号处理的卷积过程

1.3 卷积层

在这里插入图片描述

可设置 same(设置padding以保持卷积前后图片尺寸不变) 与 valid(不设置padding，卷积后图片变小) 卷积

注：① input_channels：表示输入特征图的通道数（输入层一般为RBG_num=3）
② Kernel_channels：a)表示与input_channels对应的数量；b)>表示卷积核的个数
③ Kernel_size：表示卷积核的尺寸
④ Stride：表示卷积步长
⑤ Padding：表示使用same卷积时的边缘填充大小

实际卷积场景举例
pytorch实现卷积层
nn.Conv2d(input_channel，kernel_num，kernel_size，stride，padding)
① input_channel：输入特征图通道数
② kernel_num：卷积核个数
③ kernel_size：卷积核尺寸
④ stride：卷积步长
⑤ padding：填充大小

注意：pytorch提供 out = layer(x) 的实现方式，尽量不使用forward()方法
在这里插入图片描述

1.4 池化层

在这里插入图片描述

池化层实现对卷积后的数据进行降采样，一般取size=2,stride=2，这样就是减少一半的数据

在这里插入图片描述

pytorch实现池化层
上采样的原理与pytorch实现
上采样：即使用最近邻内插法、双线性内插法、双三次内插法实现特征图放大
F.interpolate(input,scale_factor,mode)
① input：输入特征图tensor
② scale_factor：放大倍数
③ mode：上采样方式（‘nearest’，‘bilinear’，‘bicubic’）
ReLu激活函数接入在池化层之后
注：标准的CNN网络，各层接法如下：
卷积层 + BN + 池化层 + ReLu
or
卷积层 + BN + ReLu + 池化层
pytorch实现

1.5 BatchNorm

对输入值进行批量归一化，从而控制激活函数输出在有效梯度范围内，从而提高学习效率
在这里插入图片描述

在这里插入图片描述

transforms.Normalize()可以实现设定分布的的归一化处理
Batch Norm：实际上是对batch中各tensor的对应channel上数据进行归一化操作
batch Norm中涉及仿射过程， $\gamma$ 、 $\beta$ 是需要学习的参数
pytorch实现BatchNorm
① nn.BatchNorm1d(channel)适用于一维数据的归一化
a) channel：即输入通道数

在这里插入图片描述

② nn.BatchNorm2d(channel)适用于二维数据的归一化
a) channel：即输入通道数
layer.weight 对应 $\gamma$
layer.bais 对应 $\beta$
在这里插入图片描述

③ nn.BatchNorm1d()、nn.BatchNorm2d()中的参数意义
a) affine：表示是否引入 $\gamma$ 、 $\beta$ 做仿射变换（True or False）
b) eps：表示设置使归一变换中使分母不为0的最小值
c) momentum：动量值，默认为0.1
d) track_running_stats：是否追踪训练过程
e) training：表示是否处于训练过程（True or False）
在这里插入图片描述

在测试过程中，由于没有batch（批量）输入，因此需要手动的关闭BatchNorm1d\BatchNorm2d的功能，layer.eval()。同时，Test过程的BatchNorm会使用全部量做归一化
BatchNorm效果可视化展示
总结
使用BatchNorm的优点
① 收敛速度更快
② 更好的表现（得到更好的最优解）
③ 更加稳定