kernel: 内核是一个2维矩阵,长 × 宽;
filter:滤波器是一个三维立方体,长× 宽 × 深度, 其中深度便是由 多少张内核构成; 可以说kernel 是filter 的基本元素, 多张kernel 组成一个filter;
那么, 一个filter 中应该包含多少张 kernel 呢?
答:是由输入的通道个数所确定, 即,输入通道是3个特征时,则后续的每一个filter中包含3张kernel ;
filter输入通道是包含128个特征时, 则一个filter中所包含kernel 数是128张。
那么一层中应该有多少个filter 构成呢?
答: 我们想要提取多少个特征,即我们想要输出多少个特征,那么这一层就设置多少个filter;
一个filter 负责提取某一种特征,N个filter 提取 N 个 特征;
我们可以认为Filter扫过一张图片这件事,其实就是Convolution,这也是为什么Convolutional Layer要叫做Convolutional Layer的关系。
Pooling做的事情就是把图片变小,比如我们做完Convolution以后我们会得到一张图片,这一张图片裡面有很多的 Channel,那做完 Pooling 以后,我们就是把这张图片的 Channel 不变,本来 64 个 Channel 还是 64 个 Channel,但是我们会把图片变得比较狭长一点。