快速理解卷积神经网络的输入输出尺寸问题

最新推荐文章于 2024-04-16 21:40:38 发布

张君儿

最新推荐文章于 2024-04-16 21:40:38 发布

阅读量2w

点赞数 16

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40458355/article/details/79952601

版权

深度学习专栏收录该内容

3 篇文章 1 订阅

订阅专栏

一般一个神经网络的一层包括一个卷积和一个池化，这里主要讲述对输入和输出的尺寸的理解：

一、卷积

首先input输入矩阵，weight权值矩阵（滤波器）如下图429是由weight与input对应位置相乘再相加得到。

然后是步长stride和边界padding

像我们在上面看到的一样，过滤器或者说权值矩阵，在整个图像范围内一次移动一个像素。我们可以把它定义成一个超参数，从而来表示我们想让权值矩阵在图像内如何移动。如果权值矩阵一次移动一个像素，我们称其步长为 1。下面我们看一下步长为 2 时的情况：weight从右下角的204跳过113直接移步到109

可以看见当我们增加步长值的时候，图像的规格持续变小。在输入图像四周填充 0 边界可以解决这个问题。我们也可以在高步长值的情况下在图像四周填加不只一层的 0 边界。如下图：weight中心直接放到18然后依次54,51（stride=1时）

不填充0时为valid padding，填充0时为same padding (输入输出图像大小相同)

下面是三维立体卷积:

一幅图像不仅有灰度特征，有时我们也想检测它的彩色特征（RGB），我们假设一幅图像为6*6*3，这里的 3 指的是三个颜色通道，用nc表示。你可以把它想象成三个 6×6图像的堆叠。为了检测图像的边缘或者其他的特征，不是把它跟原来的 3×3 的过滤器做卷积，而是跟一个三维的过滤器，它的维度是 3×3×3，这样这个过滤器也有三层，对应红绿、蓝三个通道。

注意4*4中第一个数是由27个数字相加得到，二这27 个数字是由weight对应6*6*3中的左上角的3*3*3立方体对应相乘得到。

这里讲一个输出维度计算问题：

网上例题：

反卷积（上采样）输出特征尺寸公式：W' = （W-1）S+F-2P

二、池化层

有时图像太大，我们需要减少训练参数的数量，它被要求在随后的卷积层之间周期性地引进池化层。池化的唯一目的是减少图像的空间大小。池化在每一个纵深维度上独自完成，因此图像的纵深保持不变。池化层的最常见形式是最大池化（还有均值池化等等）。

如下图：nc有两个术语，通道或者深度

关注

16
点赞
踩
83

收藏

觉得还不错? 一键收藏
6
评论
快速理解卷积神经网络的输入输出尺寸问题

一般一个神经网络的一层包括一个卷积和一个池化，这里主要讲述对输入和输出的尺寸的理解：一、卷积首先input输入矩阵，weight权值矩阵（滤波器）如下图429是由weight与input对应位置相乘再相加得到。然后是步长stride和边界padding像我们在上面看到的一样，过滤器或者说权值矩阵，在整个图像范围内一次移动一个像素。我们可以把它定义成一个超参数，从而来表示我们想让...
复制链接

扫一扫

专栏目录

张君儿 CSDN认证博客专家 CSDN认证企业博客

码龄7年

12: 原创

14万+: 周排名

82万+: 总排名

11万+: 访问

: 等级

681: 积分

30: 粉丝

95: 获赞

19: 评论

294: 收藏

私信

关注

热门文章

分类专栏

部署 1篇
Docker安装 1篇
环境搭建 1篇
python 5篇
机器学习 2篇
深度学习 3篇
tensorflow 4篇
paper 1篇

最新评论

利用API接口密钥部署一个OCR身份证识别小程序
CSDN-Ada助手: 非常感谢CSDN博主分享的《利用API接口密钥部署一个OCR身份证识别小程序》。我觉得这篇博客非常实用，对于想学习OCR身份证识别的读者来说是非常有帮助的。下一篇博客可以尝试写一下如何利用OCR技术实现车牌识别，相信会有更多读者受益。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
快速理解tf.Session()
linuxlllover: 第二种激活方式需要缩进
快速理解tf.Session()
horus1997: 博主好，请问tensorflow的基础教程的链接方便发一下吗？
快速理解卷积神经网络的输入输出尺寸问题
LXMXHJ: 博主，博客中“网上例题”最后特征图的尺寸是不是97*97*2，2的原因是对于原图的处理经过了两个卷积层？
快速掌握Latex科技论文写作技巧
m0_51361209: 实测可运行，

最新文章

目录

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。