0. 前言
关于卷积核和过滤器的定义,事实上在使用时没有多在意,毕竟能理解作者意思即可。但是这篇文章让我理解了为什么使用深度学习框架定义卷积层时,该层的输出通道=卷积核的个数?因为在我看来,如果输入通道=3(比如RGB格式图片),卷积核个数为1,那么输出通道=3,因为卷积核对每个输入通道都进行运算。但实际上深度学习框架中定义卷积核个数,可能是指滤波器的个数。
1. 两者分别
一句话:卷积核是二维的,滤波器是三维的(高维,也可能是四维的)
- 卷积核就是由长和宽来指定的,是一个二维的概念。
- 而过滤器是是由长、宽和深度指定的,是一个三维的概念。
- 过滤器可以看做是卷积核的集合。
- 过滤器比卷积核高一个维度——深度。
在下图中,input是3通道,卷积核个数为3个,卷积输出通道为3个,output通道为1个。
从微观上看,是一个n*w*3
的input和3个3*3
的卷积核进行了运算,得到了三个输出
从宏观上看,是一个n*w*3
的input和一个3*3*3
的滤波器进行了运算,得到一个输出
所以,深度学习框架中,定义卷积层时,设定卷积核个数,更可能是指滤波器个数,这就能够解释为什么框架中卷积层的卷积核个数=输出通道数。
用图表示:
图中用“3个滤波器”描述更为准确,事实上在Pytorch中定义卷积层torch.nn.Conv2d(in_channels, out_channels,kernel_size,...)
并没有要求卷积核数量的参数,直接定义输入通道和输出通道,pytorch会自动构建出卷积数量
2. 特殊情况
当输入为1通道时,此时卷积核n *w
其实只有一个,比卷积核多深度维度的滤波器尺寸n*w*1
,其实此时卷积核就等于滤波器了。