Receptive field
-
一般认为,人类的对外界的感知都是从局部到全局的,而对于图像来说,也是局部的像素在空间上的联系较为紧密(比如离得近的像素可能具有相同的颜色纹理),距离较远的像素相关性较弱。
-
因而,每个神经元没有必要对全局进行感知,只需要对局部进行感知,然后在高层将这些局部信息组合起来,就得到了全局信息。
-
所以说,局部感知野就是指卷积层的神经元只和上一层的feature map局部相联系。
The fixed-sized CNN feature map visualization
每个维度输出feature map的数量可以用下列公式计算:
——> the number of output features in each dimension:
Example
为了简化,下图假设CNN结构是对称的正方形。所以两个维度对于所有的变量都有相同的值,如果CNN结构或者输入图片不对称,可以分开计算feature map的属性。
1、一般可视化CNN feature map
卷积(kernel_size k=3x3,padding_size p=1x1, stride s=2x2)