深度学习——卷积层理论学习

1. 什么是卷积层

  1. 卷积是一种有效提取图片特征的方法 。卷积层由若干卷积单元组成,每个卷积单元的参数都是通过反向传播算法最佳化得到的。卷积运算的目的是提取输入的不同特征,第一层卷积层可能只能提取一些低级的特征如边缘、线条和角等层级,更多层的网路能从低级特征中迭代提取更复杂的特征。
  2. 计算方法: 一般用一个正方形卷积核,遍历图片上的每一个像素点。图片与卷积核重合区域内相对应的每一个像素值,乘卷积核内相对应点的权重,然后求和, 再加上偏置后,最后得到输出图片中的一个像素值。图片分灰度图和彩色图,卷积核可以是单个也可以是多个。

2. 卷积核

  1. 我们可以把卷积核理解成一个过滤器,原图像经过卷积核的过滤后就可以得到这个图像的特征图谱
  2. 使用不同的卷积核就可以得到图像的不同特征,比如现在有一个识别时尚服饰图片并找出款式类似的项目,在这个项目里,主要是关心衣服的外形,而衣服的颜色、品牌之类的细节反而不重要了,所以需要使用卷积核过滤掉衣服的颜色等一些细节,只保留像外形特征这种有用的特征。这个可以通过索贝尔边缘检测滤波器来实现,结果如下:
    在这里插入图片描述
  3. 另外,大部分卷积核都会采用逐层递增(1⇒ 3 ⇒ 5 ⇒ 7)的方式。
  4. 多个小的卷积核叠加使用要远比一个大的卷积核单独使用效果要好的多,在连通性不变的情况下,大大降低了参数个数和计算复杂度。当然,卷积核也不是越小越好。

3. 步幅

步幅(步长)就是卷积核滑动的长度,如上图,卷积核每次移动长度为1,即步幅为1。

4. 填充

为避免经过多次卷积后矩阵变得太小,可以再矩阵周围填充一圈零来保证卷积后的矩阵跟原矩阵大小一样。如下图,用输入数据中用绿色填充的部分就是补零填充,再进卷积运算即可得到与原数据一样的大小的输出。
在这里插入图片描述

5. 单通道输入,单卷积核(2D)

这里单通道指的是输入为灰度图,单卷积核值卷积核个数是1个
在这里插入图片描述
上面是5x5x1的灰度图片,1表示单通道,5x5表示分辨率,共有5行5列个灰度值。若用一个3x3x1的卷积核对此5x5x1的灰度图片进行卷积,偏置项b=1,则求卷积的计算是:(-1)x1+0x0+1x2+(-1)x5+0x4+1x2+(-1)x3+0x4+1x5+1=1(注意不要忘记加偏置 1)。

6. 多通道输入,多(一)卷积核(空间卷积)

多通道输入、多卷积核是深度神经网络中间最常见的形式。指的是多通道输入,且用多个卷积核的情况。对于实际的图片,往往是RGB三通道的。
更详细可见https://blog.csdn.net/gwplovekimi/article/details/89890510

7. 参考资料

https://blog.csdn.net/wjinjie/article/details/105016766
https://blog.csdn.net/qq_41972927/article/details/101078473
https://blog.csdn.net/gwplovekimi/article/details/89890510

  • 3
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值