CNN 卷积神经网络

Deep Learning 理论知识

CNN 卷积神经网络


1.为什么使用CNN

对于一张图片,一个神经元不用了解整张图,通过一小部分特征就可以分辨图中存在的某些特定pattern。
Connecting to small region with less parameter
The same patterns appear in different regions.
Do almost the same thing. They can use the same set of parameters.
在这里插入图片描述
对图片subsampling 并不会改变对象,我们可以通过对图像subsampling压缩图像,在神经网络中使用更少的参数达到相同的效果。
在这里插入图片描述
CNN整个过程:
中间的卷积,池化,可以重复不断叠加。
在这里插入图片描述
在这里插入图片描述

2.CNN – Convolution

对于一个 6 *6的图像我们使用 3 *3的卷积核来进行特征提取,卷积核可以多个。
在这里插入图片描述
我们设置步长stride = 1,也就是每个卷积核移动的步长为1格,对于第一个卷积核,将图像上对应大小的像素值与卷积核进行乘积求和,得到右边的结果记录下来。
在这里插入图片描述
卷积核扫描一遍整个图像后得到右边的结果,可以看到左上角和左下角数值为3,也就说明了原图像的左上角和左下角存在与卷积核特征相对应的特征,即斜对角的数值都为1,因此我们提取了原图像斜对角为1这个特征,并传入下一层神经网络。
在这里插入图片描述
通过不同的卷积核可以提取不同的特征。得到feature map。
在这里插入图片描述
CNN – Colorful image
对于彩色图片,存在R,G,B 3个维度,因此采用的卷积核也是同样3个维度来采样。
在这里插入图片描述

Convolution v.s. Fully Connected
相比于全联接,卷积核使用相同的weight对input data不同的地方进行神经元的输入,获得的feature map 可以看作是一个个神经元,作为输入连接下一层的神经网络,由于卷积核是固定的,扫面整个图像,因此他比全联接会使用更少的参数。
在这里插入图片描述

2.CNN – Max Pooling

经过池化层,一般使用maxpooling,就是将最大的值保留下来,这里选用2*2矩阵进行池化得到以下结果:
在这里插入图片描述在这里插入图片描述
通过卷积和池化,我们等于获得了一个全新的图像,这个每个卷积核输出的图像都包含原图里的某些特征。
在这里插入图片描述

3.CNN – Flatten

全联接层
在这里插入图片描述

3.CNN – in Keras

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

3.CNN – What does CNN learn?

在这里插入图片描述
For each filter:
在这里插入图片描述

参考:NTU深度学习

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
卷积神经网络(Convolutional Neural Network,CNN)是一种深度学习模型,主要用于图像识别和计算机视觉任务。它通过卷积层、池化层和全连接层等组件来提取图像的特征,并进行分类或回归等任务。 CNN的基本原理是通过卷积操作来提取图像的局部特征,然后通过池化操作来减小特征图的尺寸和参数数量。卷积层使用一组可学习的滤波器(也称为卷积核)对输入图像进行卷积操作,从而得到一系列特征图。池化层则通过对特征图进行降采样,保留主要特征并减少计算量。最后,通过全连接层将提取到的特征映射到输出类别。 CNN的优势在于它能够自动学习图像的特征表示,而无需手动设计特征。此外,CNN还具有平移不变性和局部连接性等特点,使其在处理图像数据时表现出色。 范例:<<引用:一般的卷积神经网络,输入图像x,输出卷积后的特征F(x),一次性抽出所有的信息,梯度消失会出现,Res网络就说只学习残差即可。 [^1]。引用:VGGNet探索了卷积神经网络的深度与其性能之间的关系,通过反复堆叠33的小型卷积核和22的最大池化层,VGGNet成功地构筑了16~19层深的卷积神经网络。VGGNet相比之前state-of-the-art的网络结构,错误率大幅下降,并取得了ILSVRC 2014比赛分类项目的第2名和定位项目的第1名。 。引用:CNN的基本原理是通过卷积操作来提取图像的局部特征,然后通过池化操作来减小特征图的尺寸和参数数量。卷积层使用一组可学习的滤波器(也称为卷积核)对输入图像进行卷积操作,从而得到一系列特征图。池化层则通过对特征图进行降采样,保留主要特征并减少计算量。最后,通过全连接层将提取到的特征映射到输出类别。[^3]。 CNN是一种深度学习模型,主要用于图像识别和计算机视觉任务[^3]。它通过卷积层、池化层和全连接层等组件来提取图像的特征,并进行分类或回归等任务[^3]。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值