Padding
为了不丢弃原图信息
为了保持feature map 的大小与原图一致
为了让更深层的layer的input依旧保持有足够大的信息量
为了实现上述目的,且不做多余的事情,padding出来的pixel的值都是0,不存在噪音问题。
Convolution
因为基本场景下都会Padding ,所以feature map 的大小就会与原图一致,以保证不会丢失边缘的特征。 所有卷积的过程基本没有起到降维的作用,真正起到降维作用的是池化。
Pooling
池化是一种形式的降采样。有多种不同形式的非线性池化函数,而其中“最大池化(Max pooling)”是最为常见的。它是将输入的图像划分为若干个矩形区域,对每个子区域输出最大值。直觉上,这种机制能够有效的原因在于,在发现一个特征之后,它的精确位置远不及它和其他特征的相对位置的关系重要。池化层会不断地减小数据的空间大小,因此参数的数量和计算量也会下降,这在一定程度上也控制了过拟合。通常来说,CNN的卷积层之间都会周期性地插入池化层。