卷积神经网络

最新推荐文章于 2025-07-27 20:19:06 发布

原创最新推荐文章于 2025-07-27 20:19:06 发布 · 427 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#cnn #人工智能 #神经网络

笔记专栏收录该内容

1 篇文章

订阅专栏

本文详细介绍了卷积神经网络（CNN）的结构，包括输入层、卷积层、激活函数、池化层、全连接层和输出层，以及局部感受野和权值共享等关键概念。CNN在图像理解中的优点包括结构适应性、特征提取和分类能力，以及参数减少的高效性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

卷积神经网络（Convolutional Neural Network，CNN）是一种常用于图像识别和计算机视觉任务的深度学习模型。它的结构图通常包含以下几个主要组件：

1. 输入层（Input Layer）：接受原始图像作为输入。

2. 卷积层（Convolutional Layer）：通过应用一系列卷积核对输入图像进行卷积操作，提取图像的特征。每个卷积核会生成一个特征图。

3. 激活函数（Activation Function）：对卷积层的输出进行非线性变换，增加网络的表达能力。常用的激活函数包括ReLU、Sigmoid和Tanh等。

4. 池化层（Pooling Layer）：对特征图进行下采样，减少特征图的尺寸和参数数量，同时保留重要的特征信息。常用的池化操作包括最大池化和平均池化。

5. 全连接层（Fully Connected Layer）：将池化层输出的特征图展平成一维向量，并通过全连接层进行分类或回归等任务。

6. 输出层（Output Layer）：输出最终的分类结果或回归值。

在实际应用中，卷积神经网络可以包含多个卷积层、激活函数、池化层和全连接层，形成深层网络结构。此外，还可以使用批归一化（Batch Normalization）和dropout等技术来提高网络的性能和泛化能力。

积神经网络的核心思想就是局部感受野、是权值共享和pooling层，以此来达到简化网络参数并使得网络具有一定程度的位移、尺度、缩放、非线性形变稳定性。

局部感受野：由于图像的空间联系是局部的，每个神经元不需要对全部的图像做感受，只需要感受局部特征即可，然后在更高层将这些感受得到的不同的局部神经元综合起来就可以得到全局的信息了，这样可以减少连接的数目。

权值共享：不同神经元之间的参数共享可以减少需要求解的参数，使用多种滤波器去卷积图像就会得到多种特征映射。权值共享其实就是对图像用同样的卷积核进行卷积操作，也就意味着第一个隐藏层的所有神经元所能检测到处于图像不同位置的完全相同的特征。其主要的能力就能检测到不同位置的同一类型特征，也就是卷积网络能很好的适应图像的小范围的平移性，即有较好的平移不变性（比如将输入图像的猫的位置移动之后，同样能够检测到猫的图像）

3）卷积层、下采样层、全连接层

卷积层：因为通过卷积运算我们可以提取出图像的特征，通过卷积运算可以使得原始信号的某些特征增强，并且降低噪声。

用一个可训练的滤波器fx去卷积一个输入的图像（第一阶段是输入的图像，后面的阶段就是卷积特征map了），然后加一个偏置 bx，得到卷积层 Cx。
下采样层：因为对图像进行下采样，可以减少数据处理量同时保留有用信息，采样可以混淆特征的具体位置，因为某个特征找出来之后，它的位置已经不重要了，我们只需要这个特征和其他特征的相对位置，可以应对形变和扭曲带来的同类物体的变化。

每邻域四个像素求和变为一个像素，然后通过标量 Wx+1 加权，再增加偏置 bx+1，然后通过一个sigmoid激活函数，产生一个大概缩小四倍的特征映射图 Sx+1。
全连接层：采用 softmax 全连接，得到的激活值即卷积神经网络提取到的图片特征。

卷积神经网络相比一般神经网络在图像理解中的优点：

网络结构能够较好的适应图像的结构
同时进行特征提取和分类，使得特征提取有助于特征分类
权值共享可以减少网络的训练参数，使得神经网络结构变得简单，适应性更强