输入的图片在计算机看来的是三维数据,三维分别是(C,H,W) 。其中C (channel通道)= 3 (RGB红绿蓝)H 代表输入图片的高度,W代表输入图片的宽度。
上图右侧的87%,达不到100%是因为有些特征是共享的,所以达不到百分之100。
上图中的y=w*x+b就是神经元里面的东西,其中x是输入,y是输出,b是一个常数(表示一个偏置),w是权重也就是卷积核里面的参数。
上图中是特征图长宽的计算公式,其中stride表示步长简写为sw表示横向的步长(也就是每次卷积核横向移动的距离),sh表示(横向移动完,开始第二行移动,第二行和第一行高相距的距离?差不多这个意识吧) ,k表示kernel卷积核,kw表示卷积核的宽,kh表示卷积核的高,f表示filter过滤器,fw是过滤器的宽,fh是过滤器的高,(卷积核和过滤器是指同一个东西,只是叫法不一样)。p表示padding填充。公式里面的Xw和Xh表示输入图像的宽和高。所以已知上图中的输入图像的h*w是3*3,卷积核大小是2*2,填充是0,通过计算得到特征图的大小为2*2
上图是卷积的整个简要流程,一个三通道的输入图像经过一个三通道的卷积核,最终得到一个单通道的特征图。这是单通道的,下图是得到多通道的特征图,方法就是使用多个三通道的卷积核,每个三通道的卷积核会得到一个单通道特征图,将这些特征图放到一起就成了多通道的特征图。
https://aistudio.baidu.com/aistudio/education/lessonvideo/1033316 上图是在课节2-3 LeNet-5实战(中)里面的内容。