卷积神经网络的维度变化

最新推荐文章于 2025-02-27 17:39:33 发布

づ七爷

最新推荐文章于 2025-02-27 17:39:33 发布

阅读量1.3k

点赞数 7

分类专栏：笔记文章标签：深度学习 cnn 神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_53039581/article/details/136340484

版权

笔记专栏收录该内容

1 篇文章

订阅专栏

卷积层各尺寸

输入矩阵格式：四个维度，依次为：样本数、图像高度、图像宽度、图像通道数
输出矩阵格式：三个维度，依次为：样本数、图像高度、图像宽度、图像通道数
权重矩阵（卷积核）格式：四个维度，依次为：卷积核高度、卷积核宽度、输入通道数、输出通道数（卷积核个数）

注：输入矩阵、权重矩阵、输出矩阵这三者之间的相互决定关系

卷积核的输入通道数（in depth）由输入矩阵的通道数所决定。
输出矩阵的通道数（out depth）由卷积核的输出通道数所决定。
输出矩阵的高度和宽度（height, width）这两个维度的尺寸由输入矩阵、卷积核、扫描方式所共同决定。计算公式如下。（蓝色标注）

在这里插入图片描述

举例

标准卷积计算举例

以 AlexNet 模型的第一个卷积层为例

输入图片的尺寸统一为 227 x 227 x 3 （高度 x 宽度 x 颜色通道数），
本层一共具有96个卷积核，
每个卷积核的尺寸都是 11 x 11 x 3。
已知 stride = 4， padding = 0，
假设 batch_size = 256，
则输出矩阵的高度/宽度为 (227 - 11) / 4 + 1 = 55

理解：有96个过滤器，每个过滤器有3个卷积核。

1 x 1 卷积计算

后期 GoogLeNet、ResNet 等经典模型中普遍使用一个像素大小的卷积核作为降低参数复杂度的手段。从下面的运算可以看到，其实 1 x 1 卷积没有什么神秘的，其作用就是将输入矩阵的通道数量缩减后输出（512 降为 32），并保持它在宽度和高度维度上的尺寸（227 x 227）。

原理：卷积核的个数决定了输出的特征图的个数，也就是特征图的通道数，或者说是卷积后的输出的通道数，因此可以使用远小于原来的输入特征图通道数个1×1卷积核来压缩通道数。在这里插入图片描述

理解：有32个过滤器，每个过滤器有512个卷积核。

全连接层计算举例

实际上，全连接层也可以被视为是一种极端情况的卷积层，其卷积核尺寸就是输入矩阵尺寸，因此输出矩阵的高度和宽度尺寸都是1。在这里插入图片描述

理解：有4096个过滤器，每个过滤器有512个卷积核。

理解输出通道数

首先提出一个过滤器的概念：

卷积核就是由长和宽来指定的，是一个二维的概念。
而过滤器是是由长、宽和深度指定的，是一个三维的概念。
过滤器可以看做是卷积核的集合。
过滤器比卷积核高一个维度——深度。

通过概念可以明白，输出通道数即过滤器的个数，输入图像的通道数就代表一个过滤器包含几个卷积核。

举个例子便于理解：

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。