深度学习笔记（三十一）三维卷积及卷积神经网络

最新推荐文章于 2024-04-29 18:15:17 发布

Mr.zwX

最新推荐文章于 2024-04-29 18:15:17 发布

阅读量9.8k

点赞数 12

分类专栏：【深度学习/神经网络】Deep Learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_16763983/article/details/113797958

版权

【深度学习/神经网络】Deep Learning 专栏收录该内容

84 篇文章 46 订阅

订阅专栏

一、RGB三维图像的卷积

首先复习以下二维卷积运算的过程：

在这里插入图片描述
然后让我们看看三维图像如何进行有效的卷积运算。

计算方法和二维卷积类似，从三维图像中划分出 $3\times3\times3$ 的方块（称为卷积立方体），对这27个像素点进行卷积，即逐个元素与过滤器相乘求和，得到输出二维矩阵中的一个值。
在这里插入图片描述
三维图像和过滤器可以有不同的高和宽，但是必须有相同的通道数。在RGB这个例子中，就是有R G B三个颜色通道（组成图像中的任意颜色）

二、叠加过滤器

试想一个问题，用前面的方法可以实现垂直边缘检测和水平边缘检测，但是如果我们要检测的是更一般的边缘呢（换句话说：想检测更多的特征信息）？比如43°。这个时候需要一种方法，叫做过滤叠加。

使用垂直边缘检测过滤器，得到垂直边缘检测结果【二维】。
使用水平边缘检测过滤器，得到水平边缘检测结果【二维】。
将垂直和水平边缘检测矩阵叠加得到【三维】结果。
该【三维】结果叠加了垂直和水平检测的效果。

来看看老师的示意图：
在这里插入图片描述

三、维度总结

三维图像： $n\times n\times n_c$
过滤器： $f\times f\times n_c$
卷积输出： $n-f+1\times n-f+1\times n_c'$
其中， $n_c'=$ # $f i l t e r s$
注意，这里用到的padding=valid，stride=1.
所以更一般的卷积输出如下：
$\frac{n+2p-f+1}{s}\times \frac{n+2p-f+1}{s}\times n_c'$
输出的通道数 $n_c'$ 等于过滤器的数量，也等于检测的特征数（在上述RGB图像例子中，检测垂直和水平边缘两个特征）

四、单层卷积网络

在这里插入图片描述
计算单层网络中参数的个数
单层中图像是 $3\times3\times3$ ，过滤器数量为10，问该层有多少个参数？

每层27个位置，卷积运算后加上1个偏置值b，得到每个过滤器卷积时需要28个参数。
一共10个过滤器，作10次上述过程，共计280个参数。

可以看到，不管图像有多大，参数并不多，取决于过滤器的数量和大小，这个在卷积神经网络中称为避免过拟合。

五、符号说明

$f^{[l]}$ ：第 $l$ 层的过滤器大小

$p^{[l]}$ ：第 $l$ 层的padding数量

$s^{[l]}$ ：第 $l$ 层的stride步长

$n_c^{[l]}$ ：第 $l$ 层的过滤器数量

$f^{[l]}\times f^{[l]}\times n_c^{[l-1]}$ ：第 $l$ 层的过滤器维度

$f^{[l]}\times f^{[l]}\times n_c^{[l-1]}\times n_c^{[l]}$ ：第 $l$ 层的权重维度

$n_c^{[l]} :1\times1\times1\times n_c^{[l]}$ ：第 $l$ 层的偏置维度

$n_{H}^{[l-1]}\times n_{W}^{[l-1]}\times n_c^{[l-1]}$ ：第 $l$ 层的输入维度

$n_{H}^{[l]}\times n_{W}^{[l]}\times n_c^{[l]}$ ：第 $l$ 层的输出维度

$m\times n_{H}^{[l]}\times n_{W}^{[l]}\times n_c^{[l]}$ ：第 $l$ 层【m个样本】的输出维度（深度学习中的向量化技术）

$n_{H}^{[l]}=\lfloor{\frac{n_{H}^{[l-1]}+2p^{[l]}-f^{[l]}}{s^{[l]}}+1}\rfloor$

$n_{W}^{[l]}=\lfloor{\frac{n_{W}^{[l-1]}+2p^{[l]}-f^{[l]}}{s^{[l]}}+1}\rfloor$

六、卷积神经网络作图像分类

第一次卷积：
在这里插入图片描述
第二次卷积：

第三次卷积：

对最后一次卷积结果展开成一列向量，logistic/softmax回归得到预测结果。

七、卷积神经网络中的典型层类型

卷积层 Convolution（CONV）
池化层 Pooling（POOL）
全连接层 Fully Connected（FC）

虽然只搭建卷积层可以实现卷积神经网络，但是神经网络架构师通常会用上池化层和全连接层搭建神经网络，这两层网络比卷积层更容易搭建。将这三者结合起来，能搭建更为强大的神经网络。

祝大家2021新年快乐！祝自己2021年收获满满，能达到自己的预期！

关注

12
点赞
踩
56

收藏

觉得还不错? 一键收藏
打赏
8
评论
深度学习笔记（三十一）三维卷积及卷积神经网络

RGB三维图像的卷积计算方法和二维卷积类似，从三维图像中划分出3×3×33\times3\times33×3×3的方块（称为卷积立方体），对这27个像素点进行卷积，即逐个元素与过滤器相乘求和，得到输出二维矩阵中的一个值。三维图像和过滤器可以有不同的高和宽，但是必须有相同的通道数。在RGB这个例子中，就是有R G B三个颜色通道（组成图像中的任意颜色）叠加过滤器试想一个问题，用前面的方法可以实现垂直边缘检测和水平边缘检测，但是如果我们要检测的是更一般的边缘呢（换句话说：想检测更多的特征信息）？比
复制链接

扫一扫

专栏目录

评论 8

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Mr.zwX 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。