卷积神经网络CNN

最新推荐文章于 2024-07-12 11:45:29 发布

一枚小可爱c

最新推荐文章于 2024-07-12 11:45:29 发布

阅读量421

点赞数

分类专栏：文章文章标签： cnn 深度学习神经网络

本文链接：https://blog.csdn.net/qq_38147044/article/details/126146709

版权

文章专栏收录该内容

17 篇文章 0 订阅

订阅专栏

为什么用CNN处理图像，而不是用全连接网络？

CNN或 ConvNet)是一种具有局部连接、权重共享等特性的深层前馈神经网络.
卷积神经网络最早主要是用来处理图像信息,在用全连接前馈网络来处理图像时,会存在以下两个问题:
(1)参数太多:如果输入图像大小为100×100x3(即图像高度为100,宽度为100以及RGB3个颜色通道),在全连接前馈网络中,第一个隐藏层的每个神经元到输入层都有100 x 100 x3= 30000个互相独立的连接,每个连接都对应一个权重参数,随着隐藏层神经元数量的增多,参数的规模也会急剧增加,这会导致整个神经网络的训练效率非常低,也很容易出现过拟合.
(2)局部不变性特征:自然图像中的物体都具有局部不变性特征,比如尺度缩放、平移、旋转等操作不影响其语义信息,而全连接前馈网络很难提取这些局部不变性特征,一般需要进行数据增强来提高性能.

感受野

卷积神经网络是受生物学上感受野机制的启发而提出的,感受野(Receptive Field )机制主要是指听觉、视觉等神经系统中一些神经元的特性,即神经元只接受其所支配的刺激区域内的信号,在视觉神经系统中,视觉皮层中的神经细胞的输出依赖于视网膜上的光感受器,视网膜上的光感受器受刺激兴奋时,将神经冲动信号传到视觉皮层,但不是所有视觉皮层中的神经元都会接受这些信号.一个神经元的感受野是指视网膜上的特定区域,只有这个区域内的刺激才能够激活该神经元.

一维卷积

一维卷积经常用在信号处理中,用于计算信号的延迟累积.假设一个信号发生器每个时刻 t 产生一个信号 x ,其信息的衰减率为 $w_{k}$ ,即在k-1个时间步长后，信息为原来的 $w_{k}$ 倍,假设 $w_{1}=1$ , $w_{2}=1/2$ ， $w_{3}=1/4$ ,那么在时刻 t 收到的信号 $w_{t}$ 为当前时刻产生的信息和以前时刻延迟信息的叠加,即 $y_{t} =1*x_{t} +1/2* x_{t-1} +1/4*x_{t-2} =w_{1}*x_{t}+w_{2}*x_{t-1}+w_{3}*x_{t-2}$
我们把w1,w2, 称为滤波器( Filter)或卷积核。

下图给出了两个滤波器的一维卷积示例,可以看出,两个滤波器分别提取了输入序列的不同特征,滤波器w = [1/3, 1/3,1/3]可以检测信号序列中的低频这信息,而滤波器w= [1,-2,1]可以检测信号序列中的高频信息.

二维卷积

卷积也经常用在图像处理中,因为图像为一个二维结构,所以需要将一维卷积进行扩展,给定一个图像 $X\epsilon\mathbb{R}^{^{M\times N}}$ 和一个滤波器 $W\epsilon\mathbb{R}^{^{U\times V}}$ ,一般U<<M,V<<N,其卷积为 $y_{ij}= \sum_{u}^{U=1}\sum_{v}^{V=1}w_{uv}x_{i-u+1,j-v+1}$