图文+代码分析：caffe卷积层反向传播实现原理

最新推荐文章于 2022-11-28 11:34:51 发布

l_____r

最新推荐文章于 2022-11-28 11:34:51 发布

阅读量3.2k

点赞数 3

分类专栏：深度学习文章标签： CNN caffe 反向传播深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lr87v5/article/details/80002374

版权

深度学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

参考博客：

http://lib.csdn.net/article/aiframework/62849

http://jermmy.xyz/2017/12/16/2017-12-16-cnn-back-propagation/

http://www.zhihu.com/question/58716267

https://blog.csdn.net/l297969586/article/details/79701522

https://blog.csdn.net/buyi_shizi/article/details/51512848

首先进行定义

卷积层输入：(bottom_data)

卷积层输出：(top_data)

在正向传播时，将进行预处理获得方便计算的矩阵形式bottom_data_col_buff，设为（caffe中有函数im2col用来完成这一操作，其逆向操作为col2im即从矩阵形式转换为原特征图形式）只考虑一个样本一个输入通道一个输出通道的情况如下（caffe中对多样本多输入输出通道的情况在最后说明）：

示例中卷积核size为3*3，stride=2，pad=1，bottom_data不包括四周填充的0。

则

卷积层输出位置处梯度：(top_diff)

卷积层输入位置处梯度：(bottom_diff)

权值梯度：(weight_diff)

偏置梯度：(bias_diff)

bottom_diff，weight_diff，bias_diff都通过top_diff反向传播计算

caffe代码实现如下：

下面详细介绍bottom_diff，weight_diff，bias_diff具体求解原理

1.bottom_diff

先计算，由于是由中的某一位置的值赋值而来，一般会在bottom_data_col_buff矩阵中多个位置进行赋值，设这种关系为，一般有若干个，则，在caffe实现中只需要计算出各个位置的，即获得与bottom_data_col_buff同维度的bottom_diff_col_buff，然后col2im还原为原始特征图尺寸即可。具体如下图：

caffe代码实现如下：

2.weight_diff

，可以看出对一个

进行求导，需要遍历所有的

，和

（即bottom_data_col_buf中第k行），所以在矩阵乘时需要将top_diff放在左边，并将bottom_data_col_buf矩阵转置。具体如下图：

caffe代码实现如下：

3.bias_diff

，将所有的求和即可，实现形式为top_diff与一个全1向量相乘：

caffe代码实现如下：

对于batchsize，输入通道，输出通道不等于1的情况讨论：

1. batchsize不等于1时，caffe对一个batch内每个样本分别处理计算，把结果相加

2.输入通道，输出通道不等于1时，weight，top_data表示为一个矩阵而不是向量，bias表示为一个向量而不是一个数值

设输入feature map 尺寸H1*W1*C1，卷积核大小kw*kh，输出feature map 尺寸H2*W2*C2

则在参与矩阵运算时

top_data，top_diff的尺寸为：C2行*（H1*W1）列

weight，weight_diff的尺寸为：C2行*（kw*kh*C1）列

bottom_data，bottom_diff的尺寸为：（kw*kh*C1）行*（H1*W1）列

bias，bias_diff的尺寸为：C2行*1列

关注

3
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
图文+代码分析：caffe卷积层反向传播实现原理

参考博客：http://lib.csdn.net/article/aiframework/62849http://jermmy.xyz/2017/12/16/2017-12-16-cnn-back-propagation/http://www.zhihu.com/question/58716267https://blog.csdn.net/l297969586/article/details/79...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。