深度学习——神经网络基础

最新推荐文章于 2023-11-24 16:26:00 发布

Ah丶Weii

最新推荐文章于 2023-11-24 16:26:00 发布

阅读量421

点赞数

原文链接：https://zhuanlan.zhihu.com/p/29119239

版权

转载：知乎大佬的一篇关于卷积层与全连接层的理解https://zhuanlan.zhihu.com/p/29119239

CNN中卷积层的计算细节

在这里插入图片描述

一、卷积层尺寸的计算原理

输入矩阵格式：四个维度，依次为：样本数、图像高度、图像宽度、图像通道数(也就是通常说的Depth）。
输出矩阵格式：与输出矩阵的维度顺序和含义相同，但是后三个维度（图像高度、图像宽度、图像通道数）的尺寸发生变化。
权重矩阵（卷积核）格式：同样是四个维度，但维度的含义与上面两者都不同，为：卷积核高度、卷积核宽度、输入通道数、输出通道数（卷积核个数）
输入矩阵、权重矩阵、输出矩阵这三者之间的相互决定关系
卷积核的输入通道数（in depth）由输入矩阵的通道数所决定。
输出矩阵的通道数（out depth）由卷积核的输出通道数所决定。（也就是通常所说的filter的个数）
输出矩阵的高度和宽度（height, width）这两个维度的尺寸由输入矩阵、卷积核、扫描方式所共同决定。计算公式如下。
$\begin{cases} height_{out} &= (height_{in} - height_{kernel} + 2 * padding) ~ / ~ stride + 1\[2ex] width_{out} &= (width_{in} - width_{kernel} + 2 * padding) ~ / ~ stride + 1 \end{cases}$

二、标准卷积计算举例（池化层计算公式也是如此，只是有MAXPOOL与AVEPOOL的区别）

以 AlexNet 模型的第一个卷积层为例，
- 输入图片的尺寸统一为 227 x 227 x 3 （高度 x 宽度 x 颜色通道数），
- 本层一共具有96个卷积核，
- 每个卷积核的尺寸都是 11 x 11 x 3。
- 已知 stride = 4， padding = 0，
- 假设 batch_size = 256，
- 则输出矩阵的高度/宽度为 (227 - 11) / 4 + 1 = 55

在这里插入图片描述

三、1 x 1 卷积计算举例

后期 GoogLeNet、ResNet 等经典模型中普遍使用一个像素大小的卷积核作为降低参数复杂度的手段。
从下面的运算可以看到，其实 1 x 1 卷积没有什么神秘的，其作用就是将输入矩阵的通道数量缩减后输出（512 降为 32），并保持它在宽度和高度维度上的尺寸（227 x 227），降维。

在这里插入图片描述

四、全连接层计算举例

实际上，全连接层也可以被视为是一种极端情况的卷积层，其卷积核尺寸就是输入矩阵尺寸，因此输出矩阵的高度和宽度尺寸都是1。
在这里插入图片描述

总结下来，其实只需要认识到，虽然输入的每一张图像本身具有三个维度，但是对于卷积核来讲依然只是一个一维向量。卷积核做的，其实就是与感受野范围内的像素点进行点积（而不是矩阵乘法）。

Ah丶Weii

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习——神经网络基础

转载：知乎大佬的一篇关于卷积层与全连接层的理解https://blog.csdn.net/dcrmg/article/details/79652487CNN中卷积层的计算细节卷积层尺寸的计算原理输入矩阵格式：四个维度，依次为：样本数、图像高度、图像宽度、图像通道数输出矩阵格式：与输出矩阵的维度顺序和含义相同，但是后三个维度（图像高度、图像宽度、图像通道数）的尺寸发生变化。权重矩阵（卷积...
复制链接

扫一扫