吴恩达《深度学习专项》笔记（十）：卷积神经网络的基础构件

最新推荐文章于 2023-03-26 00:17:22 发布

大局观选手周弈帆

最新推荐文章于 2023-03-26 00:17:22 发布

阅读量1.3k

点赞数 2

分类专栏：吴恩达深度学习文章标签：深度学习 cnn 计算机视觉

本文链接：https://blog.csdn.net/a119334/article/details/125965120

版权

本文是吴恩达《深度学习专项》笔记的第十部分，主要讲解卷积神经网络（CNN）的基础构件，包括卷积、边缘检测、填充、跨步卷积、在3D数据体上卷积等概念，并探讨了为何使用CNN及其优势。

摘要由CSDN通过智能技术生成

前排提示：这周的课有很多知识点都在图中，一定要仔细地看一看图。

课堂笔记

计算机视觉

CV(Computer Vision, 计算机视觉)是计算机科学的一个研究领域。该领域研究如何让计算机“理解”图像，从而完成一些只有人类才能完成的高级任务。这些高级任务有：图像分类、目标检测、风格转换等。

想具体了解有哪些计算机视觉任务，可以直接去访问OpenMMLab的GitHub主页：https://github.com/open-mmlab 。我随手整理了一下：图像分类、目标检测、语义分割、图像补全、光流、图像超分辨率、自动抠图、姿态识别、视频插帧、视频目标跟踪、文字识别与理解、图像生成、视频理解、3D目标检测与语义分割……

现在，大多数前沿CV算法是用深度学习实现的。

但是，在CV任务上使用我们之前学的经典神经网络，会碰到一个问题：神经网络输入层的通道数与输入图像尺寸正相关。对于一幅 $64\times64\times3$ 的图像，输入的通道数是 $12288$ ；而对于一幅 $1000\times1000\times3$ 的图像，输入的通道数就高达 $3\times 10^6$ 了。而网络第一层的参数量又与输入的通道数正相关。对于一个通道数高达 $3\times 10^6$ 的输入，假设网络第一个隐藏层有 $1000$ 个神经元，那么这一层的 $W$ 将有 $1000 \times 3\times 10^6=3\times 10^9$ 个参数。有这么多参数，除非有海量的数据，不然网络非常容易过拟合。现有的数据量和计算资源还是跑不动参数这么多的网络的。

因此，在CV中，我们一般不使用之前学的经典神经网络架构，而是使用一种新的网络架构——CNN(Convolutional Neural Network, 卷积神经网络)。

教材这一段的引入新知识组织得非常棒，从参数量的角度自然而然地从全连接网络过度到卷积神经网络。

让我们从卷积神经网络最简单的构件——卷积学起，一步一步认识卷积神经网络。

边缘检测

卷积是一种定义在图像上的操作。在深度学习时代之前，它最常用于图像处理。让我们来看看卷积在图像处理中的一个经典应用——边缘检测，通过这个应用来学习卷积。

边缘检测的示意图如上所示。输入一张图片，我们希望计算机能够检测出图像纵向和横向的边缘，把有边缘的地方标成白色，没有边缘的地方标成黑色。

我们可以用卷积实现边缘检测。让我们来看看卷积运算是怎么样对数据进行操作的。

卷积有两个输入：一幅图像和一个卷积核（英文是kernel，也叫做filter滤波器），其中卷积核是一个二维矩阵。我们这里假设图像是一幅单通道 $\times 6$ 的矩阵，卷积核是一个 $\times 3$ 的矩阵。经过卷积后，我们会得到一个 $\times 4$ 的单通道图像（稍后会介绍 $\times 4$ 是怎么算出来的）。

卷积操作会依次算出输出图像中每一个格子的值。对于输出左上角第一个格子，它的计算方法如下：

首先，我们把 $\times 3$

最低0.47元/天解锁文章

大局观选手周弈帆

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
吴恩达《深度学习专项》笔记（十）：卷积神经网络的基础构件

在这堂课中，我们认识了CNN的三大基础构件卷积、池化、全连接。其中，卷积和池化是新学的知识。这堂课的内容非常多，也非常重要，让我们来回顾一下。CNN的优点CNN与全连接网络的参数比较权重共享、稀疏连接卷积操作基本运算流程填充步幅示例边缘检测卷积层对多通道图像卷积输出多通道图像加上bias，送入激活函数池化层运算流程最大池化与平均池化CNN示例如何组合不同类别的层卷积接池化，最后全连接。图像边长变小，通道数变大。https。...
复制链接

扫一扫

专栏目录