深度学习——卷积层理论学习

最新推荐文章于 2024-05-25 21:32:01 发布

AI AX AT

最新推荐文章于 2024-05-25 21:32:01 发布

阅读量3.2k

点赞数 3

分类专栏：深度学习文章标签：卷积深度学习

本文链接：https://blog.csdn.net/weixin_45758642/article/details/119379338

版权

深度学习专栏收录该内容

14 篇文章 4 订阅

订阅专栏

1. 什么是卷积层

卷积是一种有效提取图片特征的方法。卷积层由若干卷积单元组成，每个卷积单元的参数都是通过反向传播算法最佳化得到的。卷积运算的目的是提取输入的不同特征，第一层卷积层可能只能提取一些低级的特征如边缘、线条和角等层级，更多层的网路能从低级特征中迭代提取更复杂的特征。
计算方法：一般用一个正方形卷积核，遍历图片上的每一个像素点。图片与卷积核重合区域内相对应的每一个像素值，乘卷积核内相对应点的权重，然后求和，再加上偏置后，最后得到输出图片中的一个像素值。图片分灰度图和彩色图，卷积核可以是单个也可以是多个。

2. 卷积核

我们可以把卷积核理解成一个过滤器，原图像经过卷积核的过滤后就可以得到这个图像的特征图谱。
使用不同的卷积核就可以得到图像的不同特征，比如现在有一个识别时尚服饰图片并找出款式类似的项目，在这个项目里，主要是关心衣服的外形，而衣服的颜色、品牌之类的细节反而不重要了，所以需要使用卷积核过滤掉衣服的颜色等一些细节，只保留像外形特征这种有用的特征。这个可以通过索贝尔边缘检测滤波器来实现，结果如下：
另外，大部分卷积核都会采用逐层递增（1⇒ 3 ⇒ 5 ⇒ 7）的方式。
多个小的卷积核叠加使用要远比一个大的卷积核单独使用效果要好的多，在连通性不变的情况下，大大降低了参数个数和计算复杂度。当然，卷积核也不是越小越好。

3. 步幅

步幅（步长）就是卷积核滑动的长度，如上图，卷积核每次移动长度为1，即步幅为1。

4. 填充

为避免经过多次卷积后矩阵变得太小，可以再矩阵周围填充一圈零来保证卷积后的矩阵跟原矩阵大小一样。如下图，用输入数据中用绿色填充的部分就是补零填充，再进卷积运算即可得到与原数据一样的大小的输出。
在这里插入图片描述

5. 单通道输入，单卷积核（2D）

这里单通道指的是输入为灰度图，单卷积核值卷积核个数是1个。
在这里插入图片描述
上面是5x5x1的灰度图片，1表示单通道，5x5表示分辨率，共有5行5列个灰度值。若用一个3x3x1的卷积核对此5x5x1的灰度图片进行卷积，偏置项b=1，则求卷积的计算是：(-1)x1+0x0+1x2+(-1)x5+0x4+1x2+(-1)x3+0x4+1x5+1=1（注意不要忘记加偏置 1）。

6. 多通道输入，多(一)卷积核（空间卷积）

多通道输入、多卷积核是深度神经网络中间最常见的形式。指的是多通道输入，且用多个卷积核的情况。对于实际的图片，往往是RGB三通道的。
更详细可见https://blog.csdn.net/gwplovekimi/article/details/89890510

7. 参考资料

https://blog.csdn.net/wjinjie/article/details/105016766
https://blog.csdn.net/qq_41972927/article/details/101078473
https://blog.csdn.net/gwplovekimi/article/details/89890510

AI AX AT

关注

3
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
深度学习——卷积层理论学习

目录1. 什么是卷积层2. 卷积核3. 步幅4. 填充5. 单通道输入，单卷积核（2D）6. 多通道输入，多(一)卷积核（空间卷积）1. 什么是卷积层卷积是一种有效提取图片特征的方法。卷积层由若干卷积单元组成，每个卷积单元的参数都是通过反向传播算法最佳化得到的。卷积运算的目的是提取输入的不同特征，第一层卷积层可能只能提取一些低级的特征如边缘、线条和角等层级，更多层的网路能从低级特征中迭代提取更复杂的特征。计算方法：一般用一个正方形卷积核，遍历图片上的每一个像素点。图片与卷积核重合区域内相对应的每
复制链接

扫一扫