caffe学习:卷积计算

最新推荐文章于 2020-12-19 13:20:43 发布

hukai7190

最新推荐文章于 2020-12-19 13:20:43 发布

阅读量737

点赞数

分类专栏： caffe 文章标签： Caffe

本文链接：https://blog.csdn.net/hanging_gardens/article/details/79034744

版权

caffe 专栏收录该内容

17 篇文章 0 订阅

订阅专栏

在caffe中如何计算卷积的?
caffe中, 卷积网络的前向传播过程需要计算类似 $W*x+B$ 这样的连接, forward_cpu_gemm()函数用weight矩阵和输入的bottom相乘, 然后对bias进行处理, bias程序会根据情况决定是否对bias进行scale(放大/缩小).

另外可以参考知乎问题:在 Caffe 中如何计算卷积？

我们知道, caffe中的卷积运算采用的是矩阵计算, 那么caffe是如何构造卷积矩阵的.

我们可以参考下图:
这里写图片描述
具体的论文参考:High Performance Convolutional Neural Networks for Document Processing

由图可知, 传统的卷积方式与矩阵计算方式的卷积运算的区别, 后者通过预先转换, 得到输入数据与卷积核的矩阵形式, 然后进行一次矩阵运算就能得到多个卷积核的特征图.

我们假设
输入数据input_features: $W*H*D$ , 其中D是数据深度, $W*H$ 是数据大小
卷积核conv_filter: $K_w*K_H*D*M$ , 其中 $K*K$ 是核大小, D是核深度, M是核数量
卷积超参数:stride是卷积步长, $S_W$ 表示宽度方向的步长, $S_H$ 表示高度方向的步长.
卷积超参数:pad是卷积填充操作, $pad_W$ 代表宽度方向上的填充,长度 $pad_H$ 代表高度方向上的填充长度.

第一步, 先将input_features按照配置的卷积方式来转换成矩阵, 也就是图中input_features->input_features(Matrix)的过程.那么新的input_features(Matrix):

i n p u t f e a t u r e s (M a t r i x) = o f s \times (K W * K H * D)

$input_features(Matrix)=ofs\times(K_W*K_H*D)$
input_features(Matrix)是一个二维矩阵, 其中ofs代表的是output_features_size, ofs由输入数据的大小

W∗H $W*H$ 和卷积核大小

KW∗KH $K_W*K_H$ 共同确定.

o f s = [W - K W + 2 * p a d W S W + 1] \times [H - K H + 2 * p a d H S H + 1]

$ofs=[\frac{W-K_W+2*pad_W}{S_W}+1]\times [\frac{H-K_H+2*pad_H}{S_H}+1]$

第二步, 将卷积核转换成矩阵形式, 由conv_filters $K_W*K_H**D*M$ 四维转换成conv_filters(Matrix) $(K_W*K_H*D)*M$ 二维格式.

第三步, 进行矩阵运算

outputfeatures(Matrix)=input_features(Matrix)×conv_features(Matrix)={ofs∗(KW∗KH∗D)}×{(KW∗KH∗D)∗M}=ofs×M=(W−KW+2∗padWSW+1)×(H−kH+2padHSH+1)

$\begin{align} output_features(Matrix) &= input\_features(Matrix)\times conv\_features(Matrix) \\ &= \{ofs*(K_W*K_H*D)\}\times\{(K_W*K_H*D)*M\} \\ &= ofs\times M \\ &= (\frac{W-K_W+2*pad_W}{S_W}+1)\times(\frac{H-k_H+2pad_H}{S_H}+1) \end{align}$
最后将output_features(Matrix)转换成output_features