CNN--各层的介绍

本文介绍了卷积层的工作原理,包括输入尺寸、滤波器大小、输出尺寸的计算公式,以及多通道卷积的计算方法。此外,还详细解释了填充Padding的作用,用于保持图像尺寸不变。同时,讨论了池化层的功能,如Max池化和Mean池化,用于减小特征尺寸并增强模型的鲁棒性。这些基础知识是理解深度学习模型,尤其是卷积神经网络(CNN)的关键。
摘要由CSDN通过智能技术生成

卷积层Convolutional

给定卷积核,将卷积核应用于输入图片特征的对应维度的地方,计算乘积,下图以步长stride=1为例,得到最终输出层特征。

There are an input image (left), a filter (middel), and an output image (right).

Convolution step by step

假设输入大小为(H,W),滤波器大小为(FH,FW),输出大小为(OH,OW),填充padding为P,步幅stride为S
O H = H + 2 P − F H S + 1 O W = W + 2 P − F W S + 1 OH=\frac{H+2P-FH}{S}+1\\ OW=\frac{W+2P-FW}{S}+1 OH=SH+2PFH+1OW=SW+2PFW+1
对于多通道卷积计算,类似于单通道计算方法,只是将每个通道计算值最后相加

在这里插入图片描述

在这里插入图片描述

多个卷积核的卷积运算:

在这里插入图片描述

在这里插入图片描述

填充Padding

在每次进行卷积后,输出维度缩小,根据输入图像的大小,几轮卷积之后输出图像的维度可能变得太小,同时边缘的像素点少于中间的像素点,这也因此忽略了图像的部分数据,为了解决这个问题,Padding通过在边缘填充数据,达到保持输入输出图片维度一致效果。

Padding Layer

池化层Pooling

池化层来减小特则行数据的大小,并使某些特征检测更加具有鲁棒性。如果使用一个 4 × 4 4\times4 4×4的矩阵,Max池化层和Mean池化层分别进行处理后的结果如下所示,这个过程很简单。在示例中,filter是2×2,stride为 2,因此将输入分成四份 2 × 2 2\times2 2×2 的子区域,Max和Mean则是分别输出对应子区域的最大值和均值

的子区域,Max和Mean则是分别输出对应子区域的最大值和均值

Pooling Layer

上述图片来源于《深度学习入门:基于Python的理论与实现》以及网络图片

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Miracle Fan

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值