CNN基础

最新推荐文章于 2023-04-12 16:58:43 发布

m0_73692880

最新推荐文章于 2023-04-12 16:58:43 发布

阅读量260

点赞数

文章标签： cnn 深度学习神经网络

本文链接：https://blog.csdn.net/m0_73692880/article/details/129903970

版权

文章目录

@[toc]
全连接神经网络存在的问题
卷积神经网络(CNN)
前言
概述
卷积操作
卷积层
激活层
池化层
全连接层
其余常用网络层

全连接神经网络存在的问题

权重矩阵的参数过多
- 参数量会随图像尺寸的增大而激增，带来巨大的计算消耗。
- 对图像的延展性差
忽略了输入数据的局部不变性特征
- 局部不变性特征：某些特则对一定范围内的变形、旋转、缩放等操作不敏感。
- 自然图像中的物体具有局部不变性特征，如尺度缩放、平移、旋转等。
- 全连接网络很难提取到这些局部不变特征

全连接神经网络难以提取局部不变性特征的主要原因是它们忽略了输入数据的本地结构，即每个输入节点只和输出层中的一个节点相连，无法模拟数据中的空间关系，也就无法捕获图像、视频等数据的局部结构，从而难以提取局部不变性特征。

此外，全连接神经网络的参数非常多，因此容易发生过拟合问题，导致网络泛化能力下降，更容易识别过去曾经见过的数据，但是对于新数据集却没有很好的泛化表现。

相比之下，卷积神经网络（Convolutional Neural Network, CNN）采用卷积层和池化层对输入数据进行特征提取，可以有效地提取数据的空间结构信息，从而能够更好地实现图像、视频等数据的分类和识别，能够较好的处理局部不变性特征。

卷积神经网络(CNN)

前言

卷积神经网络(CNN)是一种深度学习技术，广泛应用于计算机视觉、语音识别等领域。

CNN专为具有类似网状（grid—like）的数据而生
* 1-D grid：时间序列化数据
* 2-D grid：图像数据
* 3-D grid：视频数据

CNN主要由卷积层(Convolutional Layer)、池化层(Pooling Layer)、全连接层(Fully Connected Layer)组成。其中，卷积层是CNN的核心组成部分，它通过卷积操作提取图像的特征信息，并且能够保留空间上的相关性。接下来，我们来看一下卷积操作的具体实现。

概述

局部连接：每个神经元不再和上一层的所有神经元相互连接，而只是和一小部分神经元连接，从而显著降低了参数量。
权值共享：不同位置处的神经元共享同一组权重(即卷积核中的权重)，可进一步降低参数量。
平移不变性：滤波器可以捕获与图像空间位置无关的区域特征。

卷积操作

卷积操作是CNN中最基础的操作之一，它可以用来提取图像的特征。假设有一个输入图像 $x$ 和一个大小为 $\times k$ 的卷积核 $w$ ，那么它们的卷积结果 $y$ 可以表示为：

$y_{i,j} = \sum_{p=0}^{k-1} \sum_{q=0}^{k-1} w_{p,q} x_{i+p,j+q}$

其中， $i$ 和 $j$ 表示 $y$ 中的位置， $p$ 和 $q$ 表示 $w$ 中的位置。

卷积层

卷积层是CNN的核心组成部分，它通过卷积操作提取图像的特征信息，并且能够保留空间上的相关性。卷积层通常包括一个或多个卷积核，每个卷积核可以提取出不同的特征。

超参数：

卷积核大小 $\times k$ ，滤波器个数 $m$ ，步幅 $S$ 、填充 $P$
输入为 $n_1 \times n_2 \times n_3$ 的图像经过该卷积层后的输出为 $(\frac{n_1-k+2P}{S}+1) \times (\frac{n_2-k+2P}{S}+1)\times m$
其中， $n_1,n_2,n_3$ 分别表示图像的高、宽和通道数。下面是卷积层的计算公式：

$y_{i,j,k} = \sum_{l=1}^{n_3} \sum_{p=0}^{k-1} \sum_{q=0}^{k-1} w_{p,q,l,k} x_{i+p,j+q,l} + b_k$
其中， $w_{p,q,l,k}$ 表示第 $k$ 个卷积核的第 $l$ 个通道上的第 $p$ 行 $q$ 列的权重， $b_k$ 表示第 $k$ 个卷积核的偏置。