pytorch之model.cuda()、model.train()和model.eval()的区别与作用

最新推荐文章于 2024-05-21 16:45:54 发布

科研小达人

最新推荐文章于 2024-05-21 16:45:54 发布

阅读量784

点赞数 1

分类专栏： python 文章标签： pytorch 深度学习

原文链接：https://blog.csdn.net/ZwaterZ/article/details/125651755

版权

python 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

model.cuda()
在pytorch中，即使是有GPU的机器，它也不会自动使用GPU，而是需要在程序中显示指定。调用model.cuda()，可以将模型加载到GPU上去。

model.train()
启用 BatchNormalization 和 Dropout

model.eval()
不启用 BatchNormalization 和 Dropout

model.train()&&model.eval()
PyTorch进行训练和测试时一定注意要把实例化的model指定train/eval
eval()时，框架会自动把 BN 和 DropOut 固定住，不会取平均，而是用训练好的值，不然的话，一旦test的batch_size过小，很容易就会被BN层导致生成图片颜色失真极大！
训练完train样本后，生成的模型model要用来测试样本。在model(test)之前，需要加上model.eval()，否则的话，有输入数据，即使不训练，它也会改变权值。这是model中含有batch normalization层所带来的的性质。

科研小达人

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
pytorch之model.cuda()、model.train()和model.eval()的区别与作用

训练完train样本后，生成的模型model要用来测试样本。在model(test)之前，需要加上model.eval()，否则的话，有输入数据，即使不训练，它也会改变权值。eval()时，框架会自动把 BN 和 DropOut 固定住，不会取平均，而是用训练好的值，不然的话，一旦test的batch_size过小，很容易就会被BN层导致生成图片颜色失真极大！在pytorch中，即使是有GPU的机器，它也不会自动使用GPU，而是需要在程序中显示指定。
复制链接

扫一扫

专栏目录

科研小达人 CSDN认证博客专家 CSDN认证企业博客

码龄6年

34: 原创

16万+: 周排名

152万+: 总排名

1万+: 访问

: 等级

387: 积分

3: 粉丝

23: 获赞

2: 评论

47: 收藏

私信

关注

热门文章

分类专栏

python 9篇
java 21篇
脚本 2篇
多模态 3篇

最新评论

多模态学习
以太纳吉: 请问一下，这篇论文的原文是？
in-domain和out-of-domain
世界尽头的守望: CC和SBU类似COCO Caption？采集方式和渠道都不一样。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。