dropout和BN

乐闻w

于 2023-04-01 17:15:12 发布

阅读量131

点赞数

分类专栏： pytorch 文章标签：深度学习人工智能神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45675231/article/details/129899941

版权

pytorch 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

解决过拟合的最好办法增大数据集
dropout：随机丢且一些神经元--》只有在训练数据是有效
1. 取平均的作用
2. 减少两个神经元之间复杂的共适应关系：因为dropout程序导致两个神经元不一定每次都在一个dropout网络中出现（随机森林）
关于nn.module里面内置的dropout 有三种方法：dropout，dropout
2d，dropout3d。一维数据就使用dropout，图片数据使用dropout2d，三维疏浚就使用dropout3d

dropout层一般都放在模型的厚后面
注意在测试时，dropout层时不会起作用的

model.train（）训练模式
model.eval（）预测模式
这两种模式主要影响dropout和BN层

######BN层##########
解决的事梯度消失和梯度爆炸问题
传统机器学习中的表准化也叫归一化
一般是将数据映射到指定范围，用于除去不同维度的数据的量纲以及量纲单位
#批标准化：不仅在讲数据输入模型之前对数据做标准化，在网络的每一次变换之后都应该考虑数据标准化。

好处：具有正则化的效果
提高模型的泛化能力
允许更高的学习速率从而加速收敛
BN层通常应用于卷积层或者Linear（全链接层）之后：
nn.BatchNorm1d（）--》linear层
nn.BatchNorm2d（） ---〉卷积层

实现过层：
1. 求每一个训练批次数据的均值
2. 求每一个训练批次的数据方差
3. 数据进行标准化
4. 训练参数Y，B
5. 输出y 通过Y，B的线性变换得到原来的数值，在训练的正向传播中不会改变当前输出

CNN中讲用在激活函数之前，但是用在激活函数之后可能会效果更好

乐闻w CSDN认证博客专家 CSDN认证企业博客

码龄5年

23: 原创

120万+: 周排名

47万+: 总排名

9534: 访问

: 等级

267: 积分

28: 粉丝

26: 获赞

5: 评论

54: 收藏

私信

关注

热门文章

分类专栏

pytorch 12篇
算法导论 1篇
linux 2篇
python 2篇

最新评论

GAN笔记
CSDN-Ada助手: 非常棒的博客！感谢您与我们分享您的知识和经验。我们鼓励您继续探索深度学习的世界，并希望您可以分享更多关于GAN的技术知识和实践。我们建议您撰写一篇“使用GAN生成逼真图片”的博文，这将有助于那些想要学习GAN的初学者们。期待您的下一篇博客！ 2023年博客之星「城市赛道」年中评选已开启（https://activity.csdn.net/creatActivity?id=10470&utm_source=blog_comment_city ），博主的原力值在所在城市已经名列前茅，持续创作就有机会成为所在城市的 TOP1 博主（https://bbs.csdn.net/forums/blogstar2023?typeId=3152981&utm_source=blog_comment_city），更有丰厚奖品等你来拿~。
python装饰器与闭包---装饰器
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。