晚上好,今天研究一下在卷积神经网络中,如何计算多通道输入的参数数量问题。
具体是这样的:假如现在要识别一张RGB的彩色图片,那么,它就是一个多通道输入了,请看:
最左边的是一个32x32x3的图像输入,其中3就代表有三个通道,那么对应的,它的每个卷积核就有3个通道,假设每个通道上的卷积核是5x5大小的,所以,每个卷积核就是:5x5x3,需要注意的是,不同通道上的卷积核的参数
是不共享的!
在本例中,具体算法就是:使用卷积核的三个通道与对应的输入图像数据的三个通道分别做内积,最后对应的数相加,得到输出数据28x28x1,也就是说:每个卷积核(不管它包含多少个通道)可以输出一个单通道的输出神经元!
再多总结一下:卷积核的物理含义就是用来提取某种特征的,则多个卷积核就能提取多种特征。
有了上面这些理论知识,下面的问题就很好算了,题目是:输入三通道,输出192通道,卷积核大小是3x3,问该卷积层有多少参数?
分析一下:输入通道有三个,所以每个卷积核的通道也有三个(各个通道上的参数不共享),输出通道有192个,所以,一共有192个卷积核,那么,由这些卷积核计算得到的卷积层的参数有:(3*(3*3))*192=5184个。
真TMD费劲,加油吧,少年!