![b5aeb3b951bccbcf1fecf30c0cc18a83.png](https://i-blog.csdnimg.cn/blog_migrate/680a24c61aba8802388411ac848c9139.jpeg)
点击关注了解更多精彩内容!
导言在前面的章节中,介绍了全连接神经网络的相关知识,本章将介绍一种全新的神经网络结构——卷积神经网络(Convolutional Neural Network,CNN)。在很多场合,都能看到卷积神经网络的身影,如图像识别、自然语言处理、语音识别等,但CNN最主要的应用还是在图像识别领域。因此,本章将基于图像识别问题来讲解卷积神经网络的原理。
相对于全连接神经网络而言,卷积神经网络进步的地方是引入了卷积层结构和池化层结构,这两种层结构是CNN重要的组成部分。本章首先介绍卷积神经网络的基本结构,然后用一个例子解释对卷积和池化的通俗理解。接着,从更严格的角度介绍卷积的概念、原理与实现、分类和相关性质。最后,给出池化的概念、原理与实现和分类。学习完本章内容,读者将对卷积神经网络有初步的了解。
4.1 卷积神经网络的基本结构
卷积神经网络又称卷积网络(Convolutional Networks),是在图像处理和计算机视觉领域应用较为广泛的一种神经网络。相对于全连接神经网络而言,卷积神经网络进步的地方是引入了卷积层结构和池化层结构,这两种层结构是CNN重要的组成部分。一个比较简单且用于图像分类问题的卷积神经网络结构如图4.1所示。
图4.1 卷积神经网络结构示意图
由于卷积神经网络各层中的神经元包含“深度”的概念,因而在图4.1中,每一层的单元都被组织成了一个三维立体矩阵(高度、宽度和深度)的形式。图4.1中的虚线部分展示了卷积神经网络内部连接情况。从图4.1可以看出,一个卷积神经网络主要包含5个层:输入层、卷积层、池化层、全连接层和softmax层。
(1)输入层。代表整个卷积神经网络的输入。例如,在图像分类问题中,输入是图像的像素矩阵。由前面的知识可知,如果是黑白图像,则深度为1(因为只有1个通道);如果是彩色图像,则深度为3(因为有R、G、B,3个通道)。
(2)卷积层。图4.1包含两个卷积层,卷积层实现对上一层输入的变换操作,会用到激活函数。卷积层的作用是获得更多图像的抽象特征。
(3)池化层。能够在宽度和高度方向上缩小上一层矩阵的大小,但深度并不会比上一层更深。此外,池化层能达到减少网络中参数的目的。
(4)全连接层。图4.1在卷积和池化之后构建了3个全连接层,卷积和池化可以看成是图像特征提取的结果,而全连接层的建立则是为后续分类任务做准备。
(5)Softmax层。通过该层可以得到输入样例所属种类的概率分布情况