深度学习2：卷积神经网络Convolutional Neural Network（基于Python MXNet.Gluon框架）

最新推荐文章于 2024-04-20 09:51:22 发布

绝对是谨慎提交的昵称

最新推荐文章于 2024-04-20 09:51:22 发布

阅读量1.2k

点赞数 2

分类专栏：深度学习·所思所得文章标签：神经网络卷积深度学习卷积神经网络

本文链接：https://blog.csdn.net/sunsimiaofromsh/article/details/104826449

版权

卷积神经网络概述

卷积神经网络是一种具有局部连接、权重共享等特性的深层前馈神经网络。

目前的卷积神经网络一般是由卷积层、汇聚层和全连接层交叉堆叠而成的前馈神经网络，使用反向传播算法进行训练。

卷积神经网络有三个结构上的特性：局部连接、权重共享以及汇聚。这些特性使得卷积神经网络具有一定程度上的平移、缩放和旋转不变性。和前馈神经网络相比，卷积神经网络的参数更少。

卷积 Convolution

一维卷积：一维卷积的概念来自信号处理中，用于计算信号的延迟累积。一个信号发生器每个时刻 𝑡 产生一个信号 $x_t$ ，其信息的衰减率为 $w_k$ ，即在 $k - 1$ 个时间步长后，信息为原来的 $w_k$ 倍。

例如，假设 $w_1=1,w_2=\frac{1}{2},w_3=\frac{1}{4}$ ，那么在时刻 $t$ 收到的信号 $y_t$ 为前时刻产生的信息和以前时刻延迟信息的叠加

$\begin{aligned} y_t = & w_1 \cdot x_1 + w_2 \cdot x_2 + w_3 \cdot x_3 \\ = & \sum_{k=1}^3 w_kx_{t-k+1}. \end{aligned}$

滤波器 Filter/卷积核 Convolution Kernel： $w_1,w_2,\cdots$ 称为滤波器。

假设滤波器长度为 𝐾 ，它和一个信号序列 $x_1 , x_2 , ⋯$ 的卷积为

$y_t = \sum_{k=1}^K w_k x_{t-k+1}.$

信号序列 𝒙 和滤波器 𝒘 的卷积定义为：

$\textbf{y}=\textbf{w}*\textbf{x}.$

一般情况下滤波器长度 $K$ 远小于信号序列长度 $N$ 。举一个一维卷积的例子：
在这里插入图片描述

滤波器为 $[- 1, 0, 1]$ ，图中红线表示权重乘以1，绿线表示权重乘以0，蓝线表示权重乘以-1，恰好是滤波器倒过来的顺序。权重和输入相乘后相加得到一个结果，比如前三个输入 $[1, 1, 2]$ 和滤波器的卷积结果为 $\cdot 1 +1 \cdot 0 + 2 \cdot (-1)=-1$ ，同理可以得出其他几个卷积结果。

二维卷积：卷积也经常用在图像处理中。因为图像为一个二维结构，所以需要将一维卷积进行扩展。给定一个图像 $\textbf{X} \in \mathbb{R}^{M \times N}$ 和滤波器 $\textbf{W} \in \mathbb{R}^{U \times V}$ ，一般 $U$ 远小于 $M$ ， $V$ 远小于 $N$ （对应一维情况下，滤波器长度 $K$ 远小于信号序列长度 $N$ ），其卷积为

$y_{ij}=\sum_{u=1}^U \sum_{v=1}^V w_{uv} x_{i-u+1,j-v+1}$

一个输入信息 $\textbf{X}$ 和滤波器 $\textbf{W}$ 的二维卷积定义为：

$\textbf{Y}=\textbf{X}*\textbf{W}.$

其中*表示二维卷积运算。举一个二维卷积的例子：
在这里插入图片描述
输入信息为 $\begin{bmatrix} 1 & 1 & 1 & 1 & 1 \\ -1 & 0 & -3 & 0 & 1 \\ 2 & 1 & 1 & -1 & 0 \\ 0 & -1 & 1 & 2 & 1 \\ 1 & 2 & 1 & 1 & 1 \end{bmatrix}$ ，滤波器为 $\begin{bmatrix} 1 & 0 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & -1 \end{bmatrix}$ ，将滤波器矩阵翻转180度得到 $\begin{bmatrix} -1 & 0 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & 1 \end{bmatrix}$ ，然后从左到右、从上到下的与输入信息矩阵中的每一个三阶矩阵做元素加权和，得到二维卷积结果矩阵的值。

以结果矩阵中第一行第一列的元素值为例， $\cdot (-1) +1 \cdot 0 +1 \cdot 0 + (-1) \cdot 0 + 0 \cdot 0 + 0 \cdot 0 + 2 \cdot 0 + 1 \cdot 0 + 1 \cdot 1$ ；再以结果矩阵中第一行第三列的元素值（计算方法如图赋权）为例， $\cdot (-1) +1 \cdot 0 +1 \cdot 0 + (-3) \cdot 0 + 0 \cdot 0 + 1 \cdot 0 + 1 \cdot 0 + (-1) \cdot 0 + 0 \cdot 1$ ，同理可以得出其他几个卷积结果。

下图蓝色矩阵是输入信息，绿色矩阵就是通过 $\times 3$ 卷积核作用的结果，旁边的虚线多了一圈，即补零p=1.

在图像处理中，卷积经常作为特征提取的有效方法. 一幅图像在经过卷积操作后得到结果称为特征映射（Feature Map）。下图给出在图像处理中几种常用的滤波器，以及其对应的特征映射。图中最上面的滤波器是常用的高斯滤波器，可以用来对图像进行平滑去噪；中间和最下面的滤波器可以用来提取边缘特征。

互相关 Cross-Correlation

在计算卷积的过程中，需要进行卷积核翻转。在具体实现上，一般会以互相关操作来代替卷积，（从上到下、从左到右）从而会减少一些不必要的操作或开销。

互相关：给定一个图像 $\textbf{X} \in \mathbb{R}^{M \times N}$ 和滤波器 $\textbf{W} \in \mathbb{R}^{U \times V}$ ，它们的互相关为

最低0.47元/天解锁文章

绝对是谨慎提交的昵称

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
深度学习2：卷积神经网络Convolutional Neural Network（基于Python MXNet.Gluon框架）

卷积神经网络（Convolutional Neural Network，CNN）是前馈神经网络中的一种基础的网络结构，本节从卷积计算开始始，讲解了CNN的理论知识和实际应用。本文的深度学习框架基于MXNet/GLUON框架，安装方便，上手简单。
复制链接

扫一扫