训练模型时候显存爆炸的一种可能性以及解决办法

最新推荐文章于 2024-04-16 20:42:51 发布

这个柚子有点酸

最新推荐文章于 2024-04-16 20:42:51 发布

阅读量2.9k

点赞数

原文链接：https://wstchhwp.blog.csdn.net/article/details/108405102

版权

转载：https://wstchhwp.blog.csdn.net/article/details/108405102
模型训练的时候，爆显存了，可以调整batch，对数据进行crop等等操作。
今天发现一个模型，训练ok，每次测试的时候爆显存。开始以为是因为用了全图（1920x1080略大）进行inference，这是一方面。但后来发现忘了用with torch.no_grad():这导致模型运算的时候不能释放显存（记录了梯度信息），所以显存巨大。加了之后，用了不过3G显存就够了。确实inference不需要那么多显存的，以后记着这种不正常现象如何处理。

一般训练不爆显存，测试也不会爆；训练时的显存占用远多于inference

with torch.no_grad():
                output = self.model(lr)`

这个柚子有点酸

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
训练模型时候显存爆炸的一种可能性以及解决办法

转载：https://wstchhwp.blog.csdn.net/article/details/108405102模型训练的时候，爆显存了，可以调整batch，对数据进行crop等等操作。今天发现一个模型，训练ok，每次测试的时候爆显存。开始以为是因为用了全图（1920x1080略大）进行inference，这是一方面。但后来发现忘了用with torch.no_grad():这导致模型运算的时候不能释放显存（记录了梯度信息），所以显存巨大。加了之后，用了不过3G显存就够了。确实inference不
复制链接

扫一扫

这个柚子有点酸 CSDN认证博客专家 CSDN认证企业博客

码龄7年

20: 原创

54万+: 周排名

187万+: 总排名

10万+: 访问

: 等级

542: 积分

10: 粉丝

73: 获赞

11: 评论

329: 收藏

私信

关注

热门文章

分类专栏

最新评论

有个exe文件删不掉怎么办
awacccawa: 牛，亲测有效，解决了困扰了我三天的问题
在jupyter notebook中DLL找不到指定模块
QXN01: 木有用
显存爆炸和pin_memory
FRaD: 因为设置为false的话dataset放在cpu上,GPU每次只读一个batch所以占用显存少；如果设置为true,dataset会直接放在GPU上，，这样占用显存会多
显存爆炸和pin_memory
米米碰碰碰: 您好，“即，先把dataset读到CPU上，然后GPU只读每个batch的数据，这样gpu就不会报内存不足了。”这句话我不理解，True和False影响的是cpu内存，为啥显存会受到影响
深度卷积神经网络中的patch
weixin_48031201: 我只能说不太对

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。