原理说明
caffe中的卷积计算是将卷积核矩阵和输入图像矩阵变换成两个大的矩阵,然后进行相乘得到的结果,如下图所示。
具体参数如下:
Feature Matrix
Feature Matrix的大小为 K×N ,各项参数如下:
- N=((imageh+2×padh−hernelh)/strideh+1)×(imagew+2×padw−kernele)/stridew+1)
- imageh :输入图像高度,即 N×C×W×H 中的 H
imagew :输入图像宽度,即 N×C×W×H 中的 Wpadh :在输入图像的高度方向两边各增加 padh 个单位长度
- padw :在输入图像的宽度方向两边各增加 padw 个单位长度
- kernelh :卷积核的高度
- kernelw :卷积核的宽度
- strideh :高度方向的滑动步长
- stridew :宽度方向的滑动步长
因此, N 为输出图像大小的长宽乘积,也是卷积核在输入图像上滑动可截取的最大特征数。
Filter Matrix
Filter Matrix的大小为
Output Matrix
Output Matrix是Filter Matrix和Feature Matrix的乘积,是一个 M×N 的矩阵,其中每一行代表一个输出图像即feature map,总共有 M <script type="math/tex" id="MathJax-Element-3312">M</script>个输出图像(输出图像数目等于卷积核数目)