只是自己的一些思考,如有偏颇,还望指正,相互学习
首先,从代码实现时的参数来看,比如:实现3x3卷积将3个channel的feature map处理到2个channel,那么参数维度是(3,2,3,3)容易看出参数量就是3*2*3*3(忽略偏置参数量)
如下图所示,输出为两个通道,就有两个卷积核,每个卷积核为一个通道和输入通道相同的三维卷积核
可以理解为,对于输出feature map中的每个channel,都是输入feature每个通道和对应各个通道的3*3卷积核卷积求和的结果(输出每个channel对应一组与输入channel数相等的卷积核,这样就有out_channel * in_channel*kernel_size*kernel_size的参数量