训练模型前self.model.train()和self.model.eval()

奶油泡芙shi_caicai

已于 2023-04-14 21:52:33 修改

阅读量1.7k

点赞数 1

文章标签：深度学习人工智能神经网络

于 2023-01-13 23:14:47 首次发布

原文链接：https://www.cnblogs.com/demo-deng/p/15166870.html

版权

训练模型的代码中，进行前向传播前，使用的self.model.train()和self.model.eval()，有什么用？

如果模型中有BN层(Batch Normalization）和Dropout，需要在训练时添加model.train()，在测试时添加model.eval()。
其中model.train()是保证BN层用每一批数据的均值和方差，而model.eval()是保证BN用全部训练数据的均值和方差；而对于Dropout，model.train()是随机取一部分网络连接来训练更新参数，而model.eval()是利用到了所有网络连接。

转自：https://www.cnblogs.com/demo-deng/p/15166870.html

奶油泡芙shi_caicai

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
训练模型前self.model.train()和self.model.eval()

训练模型的代码中，进行前向传播前，使用的self.model.train()和self.model.eval()，有什么用？
复制链接

扫一扫

奶油泡芙shi_caicai CSDN认证博客专家 CSDN认证企业博客

码龄3年

54: 原创

19万+: 周排名

3万+: 总排名

3万+: 访问

: 等级

730: 积分

111: 粉丝

172: 获赞

19: 评论

242: 收藏

私信

关注

热门文章

分类专栏

踩坑 7篇
算法题 10篇
JAVA笔记 4篇
python 4篇
自然语言处理 3篇
springboot 1篇
linux 2篇
下载安装 1篇

最新评论

命名实体识别ccks2020数据集的数据预处理
Dionizy: 您好~请问你有ccks2020中文医疗事件抽取的数据集嘛
力扣560. 和为 K 的子数组
CSDN-Ada助手: 算法技能树或许可以帮到你：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
解决 Plain typing.NoReturn is not valid as type argument报错
a碟: 哇噢噢噢噢噢噢噢噢噢噢噢噢噢噢噢噢噢
PyTorch torch.cuda.device_count 返回值与实际 GPU 数量不一致
CSDN-Ada助手: 恭喜您写下了第16篇博客！标题很吸引人，让我忍不住想进一步了解。对于PyTorch torch.cuda.device_count函数返回值与实际GPU数量不一致的问题，您的观察非常有趣。继续深入探索这个问题，我相信您可以为其他使用PyTorch的用户提供有价值的解决方案。另外，我想建议您在下一篇博客中，结合实际案例和详细的分析，进一步探讨PyTorch在GPU数量检测方面的问题，这将对读者有很大帮助。期待您的下一篇博客！
循环迭代时显示进度条，python自带库tqdm的使用
CSDN-Ada助手: 恭喜你完成了第20篇博客！标题很吸引人，而且内容也很实用。使用tqdm库来显示进度条，这对于循环迭代的过程中更好地跟踪进度是非常有帮助的。我很高兴看到你能够持续创作，并且分享你的学习心得和经验。对于下一步的创作，我谨提供一些建议，希望能对你有所帮助。首先，你可以探索更多与Python自带库相关的主题，比如优化代码性能的技巧或者其他常用库的使用方法。其次，你可以考虑分享一些实际应用案例，让读者更好地理解如何将所学知识应用到实际项目中。最后，建议你保持谦虚的态度，因为技术的世界是不断进步的，我们始终有学习的空间。再次祝贺你取得的进展，并期待你未来更多的创作！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。