Caffe中Batch Normalizatio操作

最新推荐文章于 2023-07-10 14:51:39 发布

h_uangzj

最新推荐文章于 2023-07-10 14:51:39 发布

阅读量269

点赞数 1

文章标签： BN参数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/h_uangzj/article/details/85335444

版权

caffe 中为什么bn层要和scale层一起使用

这个问题首先你要理解batchnormal是做什么的。它其实做了两件事。
[1] 对输入进行归一化，xnorm=x−μσ，其中， μ 和 σ是计算的均值和方差  —— 对应 Caffe BatchNorm 层
[2] 归一化后进行缩放和平移，得到输出 y=γ⋅xnorm+β                  —— 对应 Caffe Scale 层
Scale层设置bias_term=True，即对应于 β

Caffe 的 BN（BatchNorm ) 层共有三个参数参数：均值、方差和滑动系数，BN层结构如下：

layer {
   bottom: "data"
   top: "data"
   name: "bn_data"
   type: "BatchNorm"
   batch_norm_param {
       use_global_stats: false
   include:
   {
       phase:TRAIN
   }
}

layer {
   bottom: "data"
   top: "data"
   name: "bn_data"
   type: "BatchNorm"
   batch_norm_param {
       use_global_stats: true
   include:
   {
       phase:TEST
   }
}

use_global_stats：如果为真，则使用保存的均值和方差，否则采用滑动平均计算新的均值和方差。该参数缺省的时候，如果是测试阶段则等价为真，如果是训练阶段则等价为假。

moving_average_fraction：滑动平均的衰减系数，默认为0.999

eps：分母附加值，防止除以方差时出现除0操作，默认为1e-5（不同框架采用的默认值不一样）

参考链接：https://blog.csdn.net/zziahgf/article/details/78843350

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。