终于解决pytorch训练过程中CPU内存溢出的问题

最新推荐文章于 2024-04-29 23:47:16 发布

yyyyyyhx

最新推荐文章于 2024-04-29 23:47:16 发布

阅读量1.6k

点赞数 1

文章标签： pytorch 人工智能 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44616692/article/details/131016680

版权

终于解决pytorch训练过程中CPU内存溢出的问题

期待了一晚上的结果，早上起来竟然发现CPU内存溢出导致程序奔溃了，今天郁闷了一天。。。
经查询，内存溢出的常见原因有：

loss求和未加item()
num_workers过大
大量使用list转tensor

排查过程

找了好多原因，感觉上面的比较贴近，但是改了一堆，内存还是蹭蹭往上涨。后来调用了memory_profiler这个包，发现了在这里插入图片描述
我的程序中上面这部分每轮都加了70多m，可能是这个循环导致的（另外排查了好多程序都不说了。。。）

然后我把这个循环改成了下面这样
在这里插入图片描述

观察每组数据的memory占用，发现了很神奇的现象：
在这里插入图片描述

第一组数据没怎么占内存，后面重复调用同一个数据的时候内存就开始暴涨，到现在也没整明白为什么会这样。。欢迎大神们指教

解决方法

后来调用了

from einops import rearrange

把数组维度修改了一下，再一起送进网络

在这里插入图片描述
可算解决了

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
3
评论
终于解决pytorch训练过程中CPU内存溢出的问题

期待了一晚上的结果，早上起来竟然发现CPU内存溢出导致程序奔溃了，今天郁闷了一天。。。经查询，内存溢出的常见原因有：loss求和未加item()num_workers过大大量使用list转tensor。
复制链接

扫一扫

yyyyyyhx CSDN认证博客专家 CSDN认证企业博客

码龄5年

2: 原创

189万+: 周排名

119万+: 总排名

2372: 访问

: 等级

22: 积分

0: 粉丝

1: 获赞

3: 评论

5: 收藏

私信

关注

热门文章

分类专栏

雷达 1篇

最新评论

终于解决pytorch训练过程中CPU内存溢出的问题
hymsticker: 想问一下出现这种问题的原因了
终于解决pytorch训练过程中CPU内存溢出的问题
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

单脉冲测量不会产生盲速

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。