4位维度数据的卷积(W,L,H,C):
卷积核大小为(w,l,h,C),有几个卷积核,输出就有几个channel,输出的feature map也是四维。可以这么理解:
有N组且每组有C个(w,l,h)大小的一模一样的卷积核,每组在C个(W,L,H)输入图像上做三维卷积输出C个(w',l',h')的feature maps 然后pixelwise 求和得到一个(w',l',h')的feature map。N组(w',l',h')的feature maps,Concatenate得到(w',l',h',N)的feature map。
上图操作,做N次,就得到N个channel的四维数据
其他关于文章的细节可参见:
【paper reading】MVSNet: Depth Inference for Unstructured Multi-view Stereo