every blog every motto: I am a slow walker, but i never walk backwards.
0. 前言
主要讲下卷积运算和运算以后特征图的大小。
有关padding=same/valid可参考第二篇文章
1. 正文
1.1 通道数为1的情况
基本概念:
输入图像:5 * 5 * 1(Height * Width * channel,长 * 宽 * 通道)
卷积核(滤波器):3 * 3 * 1(长*宽 * 通道)
填充(padding): 在图像周围填充0,本列(图)没有
步幅(strides): 卷积核移动的间距,本列为1(可以看两幅图卷积核移动的距离)
公式字母含义说明:
输入高: inputH;
输入宽: inputW;
填充: p;
步幅:s;
输出高:ouputH;
输出宽:outputW;
卷积核:k * k
本列为正方形,仅计算outputH
计算公式:
o
u
t
p
u
t
H
=
i
n
p
u
t
H
−
k
+
2
p
s
+
1
outputH = \frac{inputH-k+2p}{s}+1
outputH=sinputH−k+2p+1
本列如下:
3
=
5
−
3
+
2
∗
0
1
+
1
3 = \frac{5-3+2*0}{1}+1
3=15−3+2∗0+1
1.2 通道数不为1(以通道数3为例)
如下图:
输入图像:4 * 4 * 3
卷积核:3 * 3 * 3(长,宽,通道数)三者没有必然联系,只是正好通道数和长宽相同
计算思想是:(输入图像和卷积核)对应通道相乘再相加
如:
1. 输入数据 最前面的一个通道 和 滤波器最前面一个通道做卷积运算 生成 一个2*2的特征图(就是1.1的单通道运算方式,这就是对应通道相乘)
2. 经过第一步的运算以后会生成3个2 * 2的特征图。将3个2 * 2对应位置的数字加到一起,最后生成输出数据(2 * 2 * 1),注意输出数据只有一个通道!!!
图解过程:
如果要生成多通道特征图,那么要多个卷积核(3 * 3 * 3),
如:上例,输入图像4 * 4 * 3,想要得到2 * 2 * 7的特征图,那么,
卷积核为3 * 3 * 3 * 7(长,宽,通道数,卷积核个数)
在看到的很多文章中不提卷积核通道数,默认和输入图像相同。
在看到的很多文章中不提卷积核通道数,默认和输入图像相同。
在看到的很多文章中不提卷积核通道数,默认和输入图像相同。
附上一个更好的图解: