如果有问题请指教!
首先你要知道卷积神经网络的计算过程,这里不再赘述,下面的图分别来自邱锡鹏老师的书(https://nndl.github.io/)和李沐大神的直播课,最重要的是这句:每个输入通道有独立的二维卷积核,所有输入通道结果相加得到一个输出通道结果;每个输出通道有独立的三维卷积核。
相关变量:
输入 ( B , C i n , H , W ) (B,C_{in},H,W) (B,Cin,H,W)
卷积核 ( C o , C i n , K , s t r i d e = S , p a d d i n g = P ) (C_o,C_{in},K,stride=S,padding=P) (Co,Cin,K,stride=S,padding=P)
输出 ( B , C o , ( H i n p u t − H k e r n e l + 2 P S + 1 ) , ( W i n p u t − W k e r n e l + 2 P S + 1 ) ) = ( B , C O , ( H − K + 2 P S + 1 ) , ( W − K + 2 P S + 1 ) (B,C_o,(\frac{H_{input}-H_{kernel}+2P}S+1),(\frac{W_{input}-W_{kernel}+2P}S+1))=(B,C_O,(\frac{H-K+2P}S+1),(\frac{W-K+2P}S+1) (B,Co,(SHinput−Hkernel+2P+1),(SWinput−Wkernel+2P+