卷积神经网络(CNN)介绍

最新推荐文章于 2024-08-05 11:09:30 发布

spearhead_cai

最新推荐文章于 2024-08-05 11:09:30 发布

阅读量3.6w

点赞数 32

分类专栏：深度学习机器学习文章标签： CNN 深度学习

本文链接：https://blog.csdn.net/lc013/article/details/80237632

版权

本文介绍了卷积神经网络（CNN）的基础知识，包括卷积层、非线性层（ReLU）、Pooling层和全连接层。讨论了卷积运算、滤波器和特征图的概念，以及CNN的优点。文中还提到了一些经典的网络结构，如LeNet、AlexNet、VGGNet和ResNets，并概述了反向传播在CNN训练中的作用。

摘要由CSDN通过智能技术生成

简单介绍和总结卷积神经网络（Convolutional Neural Networks）的基本组成网络层和常用的网络结构。

参考文章/书籍：

An Intuitive Explanation of Convolutional Neural Networks
对CNN中pooling的理解
《深度学习轻松学：核心算法与视觉实践》
ResNet解析

简介

CNN可以应用在场景分类，图像分类，现在还可以应用到自然语言处理(NLP)方面的很多问题，比如句子分类等。

LeNet是最早的CNN结构之一，它是由大神Yann LeCun所创造的，主要是用在字符分类问题。

下面是一个简单的CNN结构，图来自参考文章1。这个网络结构是用于一个四类分类的问题，分别是狗、猫、船和鸟，图中的输入图片是属于船一类。

在这里插入图片描述

该结构展示了四种运算，也可以说是由四种不同的层，分别是卷积层，非线性层(也就是使用了ReLU函数)，Pooling层，全连接层，下面将一一介绍这几种网络层。

卷积层

卷积简介

CNN的名字由来就是因为其使用了卷积运算的缘故。卷积的目的主要是为了提取图片的特征。卷积运算可以保持像素之间的空间关系。

每张图片可以当做是一个包含每个像素值的矩阵，像素值的范围是0~255,0表示黑色，255是白色。下面是一个 $\times 5$ 大小的矩阵例子，它的值是0或者1。

在这里插入图片描述

接下来是另一个 $3\times 3$ 矩阵：

在这里插入图片描述

上述两个矩阵通过卷积，可以得到如下图右侧粉色的矩阵结果。

在这里插入图片描述

黄色的矩阵在绿色的矩阵上从左到右，从上到下，每次滑动的步进值是1个像素，所以得到一个 $3\times 3$ 的矩阵。

在CNN中，黄色的矩阵被叫做滤波器(filter)或者核(kernel)或者是特征提取器，而通过卷积得到的矩阵则是称为**“特征图(Feature Map)”或者“Activation Map”**。

另外，使用不同的滤波器矩阵是可以得到不同的 Feature Map ，例子如下图所示：

![此处输入图片的描述][6]

上图通过滤波器矩阵，实现了不同的操作，比如边缘检测，锐化以及模糊操作等。

在实际应用中，CNN是可以在其训练过程中学习到这些滤波器的值，不过我们需要首先指定好滤波器的大小，数量以及网络的结构。使用越多的滤波器，可以提取到更多的图像特征，网络也就能够有更好的性能。

Feature Map的尺寸是由以下三个参数来决定的：

深度(Depth)： 深度等于滤波器的数量。
步进(Stride): 步进值是在使用滤波器在输入矩阵上滑动的时候，每次滑动的距离。步进值越大，得到的Feature Map的尺寸越小。
Zero-padding: 有时候可以在输入矩阵的边界填补0，这样就可以将滤波器应用到边缘的像素点上，一个好的Zero-padding是能让我们可以控制好特征图的尺寸的。使用该方法的卷积称为wide convolution，没有使用的则是narrow convolution。

卷积公式和参数量

上一小节简单介绍了卷积的操作和其实现的效果，接下来将介绍卷积运算的公式，以及CNN中卷积层的参数数量。

卷积是大自然中最常见的运算，一切信号观测、采集、传输和处理都可以用卷积过程实现，其用公式表达如下：
$KaTeX parse error: No such environment: align at position 8: \begin{̲a̲l̲i̲g̲n̲}̲ Y(m,n) & =X(m,…$
上述公式中 $H (m, n)$ 表示卷积核。

在CNN中的卷积层的计算步骤与上述公式定义的二维卷积有点差异，首先是维度升至三维、四维卷积，跟二维卷积相比多了一个**“通道”(channel)**，每个通道还是按照二维卷积方式计算，而多个通道与多个卷积核分别进行二维卷积，得到多通道输出，需要“合并”为一个通道；其次是卷积核在卷积计算时没有“翻转”，而是与输入图片做滑动窗口“相关”计算。用公式重新表达如下：
$Y^l(m,n) =X^k(m,n)*H^{kl}(m,n) = \sum_{k=0}^{K-1}\sum_{i=0}^{I-1}\sum_{j=0}^{J-1}X^k(m+i,n+j)H^{kl}(i,j)$