caffe合并BatchNorm和Scale层

Caffe中BatchNorm层的计算可以表示为:y = (x-mean)/sqrt(var),

Scale层的计算可以表示为:y = x*w + b,

某些情况下为了减少参数及计算量,可以将BatchNorm和Scale层合并在一起:

y = (x-mean) * w/sqrt(var) + b

即 y = x * w/sqrt(var) + b - mean*w/sqrt(var) = x * w' + b'

即新的权重与偏置为:w' = w/sqrt(var), b' = b - mean*w/sqrt(var).

def update_model():
    net = caffe.Net(proto_name, model_name, caffe.TEST)
    proto = None
    with open(proto_name) as fd:
        proto = caffe_pb2.NetParameter()
        text_format.Merge(fd.read(), proto)
    for i,layer in enumerate(proto.layer):
        bn_name = layer.name
        if layer.type == 'BatchNorm':
           next_layer = proto.layer[i+1]
           if next_layer.type == 'Scale':
               scale_name = next_layer.name
               if net.params.has_key(bn_name):
                   #bn
                   eps = 1e-5
                   mean = net.params[bn_name][0].data
                   var = net.params[bn_name][1].data
                   rescale = net.params[bn_name][2].data
                   newvar = 1.0 / np.sqrt(var*rescale)+eps
                   newmean = -mean * rescale * newvar
                   #scale
                   weight = net.params[scale_name][0].data
                   bias = net.params[scale_name][1].data
                   
                   newweight = weight * newvar
                   newbias = weight*newmean + bias
                   net.params[scale_name][0].data = newweight
                   net.params[scale_name][1].data = newbias
     net.save('new.caffemodel')                              

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值