Task5-CSDN博客

本文链接：https://blog.csdn.net/zhangzhenzhangz/article/details/104327957

卷积神经网络

主要概念有卷积层，池化层，填充，步幅，输入通道，输出通道等。

卷积层进行的是二维的互相关运算而非卷积运算。我们将kernel数组上下翻转、左右翻转，再与输入数组做互相关运算，这一过程才是卷积运算。由于卷积层的kernel是可学习的，所以使用互相关运算与使用卷积运算并无本质区别。
特征图和感受野(receptive field)的概念。某一个特征图的点，其通过两次3×3和通过一次5×5，两者的感受野是一样的。

填充，步幅对形状的影响为：
$\frac {n + 2p - k}{s}+1$ ，
p为单侧填充长度，即参数pad值。向下取整。
步长为1时，K：3×3， pad：1，不变；
K：5×5， pad：2，不变。

当有多个输入通道时，一般分通道计算并叠加。
当有多个通道输出时，通过多个核数组，提取不同层次的特征。

卷积层有利于提取局部信息。全连接层会把图片展平变为向量，相邻点不再相邻，难以捕捉局部信息。
卷积层参数更少，可以以较少的参数处理更大的图像。全连接层举例，一张彩色256*256图，输出为1000类，则权重+偏置光一层就有3×256×256×1000 + 1000个参数。
卷积层输出结果为四元张量 $(N, C, H, W)$ ，即batchsize * channel * height * width。四维中第一维为批次，第二维为通道。