AdaBN(Adaptive Batch Normalization)使用

最新推荐文章于 2024-01-25 16:00:17 发布

猫猫与橙子

最新推荐文章于 2024-01-25 16:00:17 发布

阅读量8.4k

点赞数 5

分类专栏：深度学习文章标签： AdaBN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_22764813/article/details/107044825

版权

深度学习专栏收录该内容

16 篇文章 0 订阅

订阅专栏

最近在查看论文《Towards Flops-constrained Face Recognition》时，发现作者使用了AdaBN的技巧，我很好奇AdaBN是什么操作，为甚么没有看见相应的博文介绍，下面是我自己整理的资料。

论文链接：https://arxiv.org/pdf/1603.04779.pdf

原文中的算法：

通俗理解：

把model设成训练模式，然后是做前向计算，不做反向更新，相当于只更新global mean和global variance；

将所有测试样本跑一遍，得到的最终的BN层的参数用于test测试样本；

注意：有人建议做迁移时，要将global mean 和 global var 初始成 0 （因为涉及到batchsize的大小）；

使用场景：

训练样本分布和测试样本分布不一致，模型迁移学习时使用；

参考：

1.https://www.zhihu.com/question/340407548/answer/795027833

2.http://www.doc88.com/p-9932882215443.html

附赠信息：

原作者：https://www.zhihu.com/people/naiyan-wang/answers，关于“论文投稿被拒2次，再找第三家的时候突然想放弃怎么办？”的回答；

猫猫与橙子

关注

5
点赞
踩
30

收藏

觉得还不错? 一键收藏
打赏
6
评论
AdaBN(Adaptive Batch Normalization)使用

最近在查看论文《Towards Flops-constrained Face Recognition》时，发现作者使用了AdaBN的技巧，我很好奇AdaBN是什么操作，为甚么没有看见相应的博文介绍，下面是我自己整理的资料。论文链接：原文中的算法：通俗理解：把model设成训练模式，然后是做前向计算，不做反向更新，相当于只更新global mean和global variance；将所有测试样本跑一遍，得到的最终的BN层的参数用于test测试样本；注意：有人建议做迁移时，要将gl.
复制链接

扫一扫

专栏目录

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

猫猫与橙子 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。