卷积神经网络基础知识总结

forever compass

于 2023-01-12 19:28:09 发布

阅读量672

点赞数

文章标签： cnn 深度学习计算机视觉

本文链接：https://blog.csdn.net/qq_43335624/article/details/128663131

版权

卷积神经网络基础知识总结

引言
卷积层
池化层
- 池化操作
- 池化层的超参数与理解
总结

引言

虽然已经阅读过一两本深度学习相关的入门书籍，也看了一些课程，自认为已经打好了基础，但是最近在阅读论文的时候还是发现对CNN的学习中存在很多漏洞和不理解的地方。

因此重新去认真学习了吴恩达大神的课程，并对知识加以梳理。本篇博文主要梳理卷积神经网络的基本知识。有漏洞或者错误之处，欢迎指正，交流的过程就是学习的过程。

卷积层

卷积运算与卷积核

卷积运算是卷积神经网络最重要最基本的运算，用于提取输入图像的特征。

说到卷积运算，先说说卷积核。在不同论文中，卷积核有不同叫法，有的叫核（kernel），有的叫滤波器（filter），实际上都是一种东西。卷积核是一个f×f的矩阵，用于与输入图像或多维数据做卷积运算，n多为奇数，有5×5、3×3等尺寸。在一个卷积层中，卷积核未必只有一个，可能有多个，卷积核的数量也叫作通道数。这时候，每个卷积核分别与输入图像做卷积运算，就会输出多通道特征图。

关于卷积运算的操作方法，简单来说，就是卷积核在输入图像这个窗口内滑动，卷积核覆盖位置上对应元素相乘求和，得到输出图像上对应位置的值。不再详细介绍。要注意的是，卷积层和全连接层一样，也是存在偏置参数的，每个通道进行卷积运算后都需要加上对应通道的偏置量。

必须要提的一点是，在信号处理和某些数学领域，卷积操作的定义中，给出的卷积核不能直接在窗口中滑动运算，而是先进行一个镜像翻转，这时候得到的核才是我们上面所说的卷积核。而上一段简要介绍的跳过镜像翻转的运算操作也被叫做互相关操作（correlation）。现在在很多深度学习的文献或书籍中，习惯于直接把互相关叫做卷积，但是也有保留互相关这一说法的（比如我之前阅读的SiamFC论文）。

再多说点卷积运算的一点小应用。大家会发现，在图像处理算法中，一些传统边缘检测算法就是采用了卷积运算，采用精心设计的卷积核就可以进行某个轴向上的边缘提取，比如Sobel算法。吴恩达老师给出了一个简单易懂的图例，这里就提取了中间纵向的边缘。
在这里插入图片描述

三维卷积

对于三维卷积，同样引用吴恩达老师简单易懂的图来理解：
在这里插入图片描述
可以看到，对于输入为三通道的一幅输入图像，对应的一个卷积核也是三通道的（不要与前面所说多个卷积核构成多通道输出的通道概念混淆）。input 和kernel对应通道的二维数据各自做卷积运算后，再对三个通道的运算结果求和，最后会输出一幅一通道的二维图像，然后加上该卷积核对应的偏置值。