merge卷积和bn层的原理

Mr.RottenPeach

已于 2022-05-10 15:30:56 修改

阅读量5.6k

点赞数 1

分类专栏：深度学习模型压缩文章标签： caffe 深度学习 cnn

于 2020-12-10 21:36:31 首次发布

本文链接：https://blog.csdn.net/racesu/article/details/111002511

版权

深度学习同时被 2 个专栏收录

10 篇文章 1 订阅

订阅专栏

模型压缩

4 篇文章 0 订阅

订阅专栏

《merge卷积和bn层的原理》

这是一个在移动端非常实用的技巧，而且丝毫不会影响模型的精度，而提高模型的运算速度，就是把BN层离线的时候做好，放在权重值和偏执项中就可以了。

Key Words：merge卷积层和BN层

Beijing, 2020

作者：RaySue

Agile Pioneer

为了让部署的caffe模型获得更高的推理效率，一个技巧就是合并卷积层和BN层，通过离线的对网络的权重值进行计算，来一定程度的减少计算量。

BN层的融合即为将caffe中BN层与Scale层融合进Convolution的权重之中，把三层减少为一层，适用于训练完成的模型部署阶段，而不能用在训练中。

假设每一层的输入均表示为X，权重为W，则卷积层可以写作
$X_{out} = WX_{in}+b \space\space\space\space\space\space\space\space\space\space\space\space (1)$
BN层操作，一个是归一化（caffe的BatchNorm），另一个是平移和缩放（caffe的Scale）其中caffe的BatchNorm操作为：
$X_{norm} = \frac{X_{out}−mean}{\sqrt{var}} \space\space\space\space\space\space\space\space\space\space\space(2)$
caffe的BN层之后的Scale的操作是平移和缩放, 其中 $\alpha$ 和 $\beta$ 是通过迭代学习的：
$X_{bn} = \gamma \times X_{norm}+\beta \space\space\space\space\space\space\space\space\space\space\space\space (3)$
合并上述(1)、(2)、(3)式，即可得到：
$X_{bn} = \gamma \times \frac {(WX_{in}+b) - mean} {\sqrt{var}} + \beta \space\space\space (4)$
展开（4）：
$X_{bn} = [\frac{\gamma}{\sqrt{var}}W] \times X_{in} + [\frac{\gamma}{\sqrt{var}}(b - mean) + \beta] \space\space\space (5)$
所以只需要通过训练得到的mean、var、 $\alpha$ 、 $\beta$ 通过如下式子修改原始的W和b即可：
$W_{new} =\frac{\gamma}{\sqrt{var}}W \space\space\space$
$\space\space\space b_{new}=\frac{\gamma}{\sqrt{var}}(b - mean) + \beta \space\space$

Caffe 中的合并层

layer {
    bottom: "conv1"
    top: "conv1"
    name: "scale_conv1"
    type: "Scale"
    scale_param {
        bias_term: true // 合并后的bias_term必须为true
    }
}

参考

https://blog.csdn.net/zym19941119/article/details/84635371
https://blog.csdn.net/hjxu2016/article/details/81813535

Mr.RottenPeach

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
merge卷积和bn层的原理

《merge卷积和bn层的原理》这是一个在移动端非常实用的技巧，而且丝毫不会影响模型的精度，而提高模型的运算速度，就是把BN层离线的时候做好，放在权重值和偏执项中就可以了。Key Words：merge卷积层和BN层 Beijing, 2020作者：RaySue Agile Pioneer 为了让部署的caffe模型获得更高的推理效率，一个技巧就是合并卷积层和BN层，通过离线的对网络的权重值进行计算，来一定程度的减少计算量。 BN层的融合即为将caffe中BN层与.
复制链接

扫一扫

专栏目录