pytorch训练技巧-模型设计-Relu和BN的顺序问题

最新推荐文章于 2023-12-20 21:19:20 发布

神创之初

最新推荐文章于 2023-12-20 21:19:20 发布

阅读量905

点赞数

文章标签： pytorch python pycharm

原文链接：https://www.cnblogs.com/zi-wang/p/12295529.html

版权

关于bn与relu的顺序的问题

关于bn和relu的相对顺序网上的见解不一致，但在resnet、mobilenetv2、detectron2、maskrcnn_benchmark见到的都是conv+bn+relu的顺序，没见过conv+relu+bn的顺序，遂感到很疑惑，于是上网上查了一下。

从数据饱和区的角度讲有比较好的讨论，即如果先进行relu，那么在bn的时候有些单元已经失活了，造成bn不稳定，影响模型性能；bn将数据分布进行标准化，使数据回到非饱和区，然后在经过relu可以控制激活的饱和程度。这里可以假设从conv出来的数据很大部分进入失活，那么先relu再bn的结果就不稳定了。因此应该将置于relu之前。

参考知乎的这个问题，也有提到从实验效果上看先relu再bn效果会更好一些，因为bn的作用就是对上层的输出进行归一化。

个人感觉还是偏向第一种，即conv+relu+bn。如果采用第二种方式，如果效果更好的话应该需要采取措施避免数据再relu之前进入饱和区，最直接的做法就是降低学习率和增大批处理数量。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
pytorch训练技巧-模型设计-Relu和BN的顺序问题

Relu和BN的顺序问题
复制链接

扫一扫

博客等级

码龄7年

19
原创

7
点赞

51
收藏

4
粉丝

关注

私信

热门文章

最新评论

ctcdecode安装
每天都要写bug: 您好，想请问下您的环境python, torch和cuda版本分别是怎么样的呀？我的总是报不兼容的错误。
ctcdecode安装
hjing22: 你好，想问下我安装成功之后一直报错这个ModuleNotFoundError: No module named 'ctcdecode._ext'，但是我也退出了ctcdecode的目录但是还是报错这是什么原因。
pytorch使用技巧- torch.backends.cudnn.benchmark
weixin_40888946: 讲的很清楚，感谢博主分享！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。