Caffe中为什么在bn层后要有scale层

参考:https://zhidao.baidu.com/question/621624946902864092.html

这个问题首先你要理解batchnormal是做什么的。它其实做了两件事。
 
1) 输入归一化 x_norm = (x-u)/std, 其中u和std是个累计计算的均值和
   
方差。

2)y=alpha×x_norm + beta,对归一化后的x进行比例缩放和位移。其中alpha
   
和beta是通过迭代学习的。那么caffe中的bn层其实只做了第一件事。scale
   
层做了第二件事。
  
这样你也就理解了scale层里为什么要设置bias_term=True,这个偏置就对应

2)件事里的beta。
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

勤劳的凌菲

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值