感受野:
感受野的定义是卷积神经网络输出的特征图上每个像素点在原始图像(网络的输入图像)上映射的区域大小,感受野的值越大表示其能接触到的原始图像范围越大,意味着蕴含更全局、语意层次更高的特征;感受野越小,特征越局部和细节。
感受野的计算:
r代表感受野大小,k代表卷积核(k*k),s代表步长,则感受野计算公式为:
第n层感受野大小=上一层感受野大小+(第n层卷积核大小-1)乘以本层以前所有stride的乘积。
原图像的感受野为1 r0=1
第一层: k=3*3 s=1 r1=1+2=3
第二层:k=5*5 s=2 r2 = 3+4*1=7
第三层:k=3*3 s=2 r3 = 7+2*(1*2)=14
DepthWise卷积:
标准卷积:假设有一个3*3大小的卷积层,其输入通道为16,输出通道为32,32个3*3会遍历16个通道中每个数据产生32个特征图(输出通道)[3,3,16,32]。
深度可分离卷积:用16个3*3大小的卷积核分别遍历16个输入通道的数据,然后再用32个1*1大小的卷积核遍历16个特征图相加融合得到32个特征图(输出通道)[3,3,16,1]和[1,1,16,32]。
卷积核大小K_w*K_h,输入通道为C_in,输出通道为C_out,输入特征图尺寸为W*H,标准卷积层和深度可分离卷积的参数量和计算量(偏置项b=1):
参数量:
标准卷积层:(K_w*K_h*C_in+b)*C_out
深度可分离卷积:K_w*K_h*C_in+(1*1*C_in+b)*C_out
计算量:
标准卷积:K_w*K_h*C_in*C_out*W*H
深度可分离卷积:K_w*K_h*C_in*W*H+C_in*C_out*W*H