darknet的batch_norm是如何融合到卷积层conv的

MiltonY

已于 2024-03-15 22:48:58 修改

阅读量651

点赞数

分类专栏：计算机视觉深度学习网络层深度学习知识点文章标签：神经网络前向传播融合 batch_norm conv

于 2021-05-07 16:41:16 首次发布

本文链接：https://blog.csdn.net/YMilton/article/details/116496156

版权

计算机视觉同时被 3 个专栏收录

18 篇文章 8 订阅

订阅专栏

深度学习知识点

9 篇文章 0 订阅

订阅专栏

深度学习网络层

4 篇文章 0 订阅

订阅专栏

前向传播中，batch_norm与conv的融合

1. batch_norm层的前向传播

其中mean(X)表示训练过程中得到的滑动平均值，var(X)表示训练过程中得到的滑动方差。具有泛化整个训练过程所有的图片的像素值。 $\gamma$ 表示缩放因子， $\beta$ 表示为平移因子，为学习过程中学习到的值。

2. conv层的前向传播

其中W表示为卷积核，b表示为偏置，卷积层一般为0。

3. 合并batch_norm与conv

4. darknet中的函数fuse_conv_batchnorm

5. matlab版本的fuse_conv_batchnorm

% 融合batch_norm、激活函数到conv中
function obj=fuse_conv_batchnorm(conv,bn,activate_fun)
    obj = conv;
    obj.activate_fun = activate_fun; % 激活函数
    eps = 1e-5;
    if ~isempty(bn)
        % conv层的weights融合,矩阵运算
        bn_w = bn.gamma./sqrt(bn.rolling_var + eps);

        % 第一种方法。conv.kernels size:[3,3,3,n], bn_w size:[1,1,n]。
        % reshape后：conv_kernels size:[27,n], bn_w size: [1,n]
        tmp = reshape(conv.kernels,[],conv.filters).*reshape(bn_w,[],conv.filters);
        obj.kernels = reshape(tmp,size(conv.kernels)); % 相乘之后reshape为[3,3,3,n]
        
        % 第二种方法     
%       for k = 1:conv.filters
%           obj.kernels(:,:,:,k) = conv.kernels(:,:,:,k)*bn_w(:,:,k);
%       end

        % conv层bias融合
        obj.bias = bn.beta - bn.rolling_mean.*bn.gamma./sqrt(bn.rolling_var + eps);
    end
end

MiltonY

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
darknet的batch_norm是如何融合到卷积层conv的

前向传播中，batch_norm与conv的融合1. batch_norm层的前向传播其中mean(X)表示训练过程中得到的滑动平均值，var(X)表示训练过程中得到的滑动方差。具有泛化整个训练过程所有的图片的像素值。表示缩放因子，表示为平移因子，为学习过程中学习到的值。2. conv层的前向传播其中W表示为卷积核，b表示为偏置，卷积层一般为0。3. 合并batch_norm与conv4. darknet中的函数fuse_conv_batchnorm...
复制链接

扫一扫

专栏目录