从全连接到卷积

李峻枫

已于 2022-07-17 20:38:45 修改

阅读量752

点赞数 2

分类专栏：笔记 Python # 神经网络文章标签：算法机器学习人工智能卷积神经网络

于 2022-07-17 20:38:02 首次发布

本文链接：https://blog.csdn.net/lijf2001/article/details/125836279

版权

笔记同时被 3 个专栏收录

52 篇文章 2 订阅

订阅专栏

神经网络

28 篇文章 0 订阅

订阅专栏

Python

21 篇文章 0 订阅

订阅专栏

前言

作为图像处理中的一大核心工具，卷积已经应用在各个方面。但是卷积是如何而来的呢？
从某种意义上来说，我们可以认为卷积是一种特殊的全连接，它就是从全连接层，根据某些图片的特点，演变而来的。因为全连接网络在处理图片上存在着很多问题。

全连接处理图片

利用全连接层处理图片，并不是不可以，对于与一些简单的数据，比如说MNIST手写数据集，就可以通过全连接来实现。因为它图片数据非常小，只有 $28\times 28$ ，784个像素。
但是对于一张现实中的图片，显然不只有七百多个像素，千万像素是非常正常的。
那么就来简单的计算一下：
$\newline 假设隐藏层有100000个结点 \newline 权重共有10000000\times 100000=10^{12}个数 \newline 假设其类型为32位浮点数，每个占用4字节。 \newline \frac{4\times 10^{12}}{1024\times 1024\times 1024}\approx 3725.3GB$
这是个巨大无比的数字，暂且不说如何训练，就存储都是一个严重的问题。

图像识别的原则

从现实生活中，人类如何识别物体？
看这张图片：
在这里插入图片描述
图中有两只小狗，为了识别他们，只需要看红框框内的东西就足够了，并不需要看完整张图片。
无论是在左侧的红框框里，还是右侧的红框框里，它都是狗狗，也就是说与位置无关。
因此，就可以得到图片识别的两个原则。

局部性原则

识别一个物体，只需要局部信息，即这个物体附近的信息即可，并不需要整张图片完整的信息。

平移不变性原则

无论物体在图片中的哪个位置，它依然是这个物体，它与位置无关。

数学推导

先看一下全连接是怎么转移的。
$H_{i}=\sum_{k}W_{i,k}\times X_{k} +B$
而在图片处理上，输入和输出都是二维的，同理可写出二维全连接的转移。
$H_{i,j}=\sum_{k,l}W_{i,j,k,l}\times X_{k,l} \newline \Rightarrow H_{i,j}=\sum_{a,b}W_{i,j,a,b}\times X_{i+a,j+b}$
接下来就是利用图片识别的两个原则进行化简了，首先先看平移不变性：W应该与位置无关，即W与i，j无关，故可以得出：
$H_{i,j}=\sum_{a,b}W_{a,b}\times X_{i+a,j+b}$
接下来运用局部性原则，一个位置的值只与它附件的点有关，与距离它很远的点无关，即限制了a，b的取值范围。
$H_{i,j}=\sum_{a=-\delta}^{\delta} \sum_{b=-\delta}^{\delta} W_{a,b}\times X_{i+a,j+b}$
这时候，不难发现，W就是一个卷积核了。

李峻枫

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
从全连接到卷积

作为图像处理中的一大核心工具，卷积已经应用在各个方面。但是卷积是如何而来的呢？从某种意义上来说，我们可以认为卷积是一种特殊的全连接，它就是从全连接层，根据某些图片的特点，演变而来的。因为全连接网络在处理图片上存在着很多问题。......
复制链接

扫一扫