参考链接:https://www.analyticsvidhya.com/blog/2017/06/architecture-of-convolutional-neural-networks-simplified-demystified/
1.机器如何看一幅图像
简单地说,每幅图像都是按特定顺序排列的点(像素)。
卷积神经网络所做的是:要理解一幅图像,对于一个网络来说,理解像素的排列是非常重要的。
卷积神经网络的三个基本组件:卷积的层;池层(可选);输出层
2.卷积层
The concept of stride and padding
same padding:输出图像的大小与输入图像的大小相同。
3.池化层
有时当图像太大时,我们需要减少可训练参数的数量。
池化唯一目的是减小图像的空间大小。池化层最常用的形式是最大池化。
4.输出尺寸
(1)深度:等于应用的过滤器的数量。
输入图片大小 W×W
Filter大小 F×F
步长 S
padding的像素数 P
(2)长和宽:N = (W − F + 2P )/S+1
5.输出层
卷积和池化层只能从原始图像中提取特征并减少参数的数量。
为了生成最终的输出,我们需要应用一个完全连接的层来生成一个与我们需要的类数量相等的输出。