【深度学习】卷积神经网络

Data艺术家

已于 2022-06-06 09:39:08 修改

阅读量1.2k

点赞数 3

分类专栏：深度学习文章标签：卷积神经网络深度学习神经网络

于 2022-04-30 23:54:29 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_52762273/article/details/124521208

版权

深度学习专栏收录该内容

5 篇文章 1 订阅

订阅专栏

卷积神经网络

续接上文卷积运算&边缘检测

步幅 stride

卷积中的步幅是构建卷积神经网络的基本操作

例如：我们将步幅(stride=2)设置为2，7x7的矩阵与右边的filter进行卷积运算；
在这里插入图片描述

与之前的卷积运算不同的是我们之前步幅为1时，移动filter向右一格，而此时步幅为2时则移动两格；

在这里插入图片描述

而当我们向下移动时，也是移动两格而非一格

在这里插入图片描述

如此经过卷积运算，我们最终得到一个3x3的输出矩阵

7x7 * 3x3 = 3x3；

由此可总结出一个输入输出的公式(padding = p,stride = s = 2)：nxn * fxf = (n+2p-f)/s+1 x (n+2p-f)/s+1

(7+0-3)/2+1 = 3

如果商不为时我们向下取整，也就是在过滤器移动过程中只有过滤器整体处于原有矩阵或填充后矩阵中时，才输出相应结果

在这里插入图片描述

数学中的卷积

以6x6 * 3x3 卷积运算为例，做元素乘积求和之前，首先要做的一步就是将3x3的过滤器沿水平和垂直轴翻转，相当于对过滤器做了一个镜像，按照机器学习的惯例，我们通常不进行翻转操作，从技术上说这个操作可能叫做互相关更好，对于一些信号处理应用来说很好，但对于深度神经网络来说，他真的不重要，因此也就省去了双重镜像操作简化了代码，并使神经网络也能正常工作；根据惯例我们大多人都叫它卷积，数学上更喜欢称之为互相关

在这里插入图片描述

三维卷积

我们已经知道了如何在二维图像上如何进行卷积，接下来我们看看如何在三维立体上执行卷积

如果我们想检测RGB彩色图像的特征，如果彩色图像大小为6x6,那么它就是6x6x3,这里的3指的是三个颜色通道，我们可以想象为三个6x6图像的堆叠

在这里插入图片描述

而进行卷积运算使用的过滤器也不是原来的3x3，而是跟一个立体的三维的过滤器，它的维度就是3x3x3,这样一来过滤器也有三层，对应红绿蓝三个通道；

在这里插入图片描述

我们对图像6x6x3这三个数字进行命名(过滤器也如此)：

6–>height 图像的高

6–>width 图像的宽

3–>channels 通道数

图像的通道数必须和过滤器的通道数相匹配，所以这两个数字必须相等

在这里插入图片描述

输出：4x4x1 我们看看其中细节

在这里插入图片描述

首先要做的就是把3x3x3的过滤器放到最左上角位置，过滤器有27个参数也就是3^3,依次取这27个数然后乘以相应的红绿蓝通道中的数字，先取红色通道的前9个数字然后是绿色通道，再然后是蓝色通道，乘以左边黄色立体覆盖的对应的27个数，然后把这些数加起来，就得到了输出的第一个数字

在这里插入图片描述

第二个输出则将立方体过滤器向右滑动一个单位再进行卷积操作

依次得到4x4的特征矩阵，那么这个能干什么呢？

如果我们想检测图像红色通道的边缘，我们可以设计如下过滤器:

在这里插入图片描述

如果我们把这三个堆叠起来，形成一个3x3x3的过滤器，那么它就是一个检测垂直边缘的过滤器并且只对红色通道有用

如果我们不关心垂直边缘在哪个颜色通道里，可以设计这样一个过滤器：

在这里插入图片描述

对三个通道都进行垂直边缘检测，该过滤器用于检测任意颜色通道里的边界，参数选择的不同，你就可以得到不同的特征检测器

现在我们已经了解如何对三维立体卷积，如果我们想同时检测垂直和水平边缘，45°倾斜的边缘还有七十度倾斜的边缘我们该怎么做？

换句话说，如果我们同时用多个过滤器怎么办？

在这里插入图片描述

我们使用不同的过滤器对图像进行卷积得到不同的特征矩阵，然后我们把这两个4x4的卷积取第一个放在前面，然后取第二个输出放在后面，把这两个输出堆叠在一起你就得到一个4x4x2的输出立方体，这里的2来源于使用了两个不同的过滤器进行卷积；

在这里插入图片描述

总结：nxnxnc * fxfxnc --> n-f+1xn-f+1xnc’

对立方体卷积，我们可以检测2个特征，比如垂直和水平边缘，或者10个或者128个或者几百个不同的特征并且输出的通道数会等于你要检测的特征数

channels在这里用来表示通道数，我们在文献里也叫做三位立方体的深度，不管是通道还是深度都经常出现在文献里，但是深度容易与神经网络深度混淆，所以我们经常习惯称为通道这个术语，来表示过滤器第三个维度的大小

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
3
评论
【深度学习】卷积神经网络

续接上文卷积运算&边缘检测卷积中的步幅是构建卷积神经网络的基本操作例如：我们将步幅(stride=2)设置为2，7x7的矩阵与右边的filter进行卷积运算；与之前的卷积运算不同的是我们之前步幅为1时，移动filter向右一格，而此时步幅为2时则移动两格；而当我们向下移动时，也是移动两格而非一格如此经过卷积运算，我们最终得到一个3x3的输出矩阵7x7 * 3x3 = 3x3；由此可总结出一个输入输出的公式(padding = p,stride = s = 2)：nxn * fxf = (n+2p-f)/
复制链接

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Data艺术家 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。