自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

qq_52712475的博客

原创使用多线程监听模型训练过程中实际显存占用nvidia-smi

在使用torch.cuda.max_allocated_memory时只能返回torch tensor占用显存大小，需要加上模型的大小，而模型的加载大小也不是单纯的model文件夹的大小，此时只能使用watch -n 0.1 nvidia-smi的指令进行人肉监听。除此外，TRT等运行时也不支持torch.cuda的方法。这里我开了个线程用于监听内存。

2023-09-08 16:44:13 164 2

原创 D2L，Pytorch win10下使用dataloader时出现runtimeerror: dataloader worker (pid(s) ) exited unexpectedly的解决方案

我是用python3.8+pytorch1.11，在李沐老师的课程展示中使用的环境是linux没有报错，但win10下在dataloader使用前需要加上。网上还有其他方法将num_worker设为0也可以单线程成功运行,不过直接导入d2l的dataloader没有对应的参数。freeze_support()函数在linux和类unix系统上可直接运行，在windows系统中需要跟在main后边。程序在运行时启用了多线程，而多线程的使用用到了freeze_support()函数。

2023-03-29 20:07:45 7434 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

疏而 CSDN认证博客专家 CSDN认证企业博客

码龄4年

IP 属地：上海市

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

2: 原创

104万+: 周排名

181万+: 总排名

7598: 访问

: 等级

33: 积分

0: 粉丝

10: 获赞

4: 评论

18: 收藏

私信

关注

热门文章

最新评论

使用多线程监听模型训练过程中实际显存占用nvidia-smi
weixin_47168537: 请问这个这么结合模型训练代码一起用
使用多线程监听模型训练过程中实际显存占用nvidia-smi
CSDN-Ada助手: 非常棒的博文！你的讲解十分清晰，让我对使用多线程监听模型训练过程中实际显存占用有了更深入的理解。你的方法确实很实用，既解决了torch.cuda.max_allocated_memory无法获取完整信息的问题，又解决了TRT等运行时不支持torch.cuda的情况。同时，你还提到了使用watch -n 0.1 nvidia-smi指令进行人肉监听，这是一个非常有用的技巧。另外，关于模型大小的计算，除了考虑model文件夹的大小，还可以考虑模型的参数数量、模型的层数等因素，这也会对显存的占用有所影响。另外，如果你对显存占用的优化感兴趣，可以了解一下深度学习模型压缩和剪枝的技术，这些方法可以帮助减少模型的显存占用。希望你能继续分享你的经验和知识，期待看到更多关于深度学习和显存管理的博文！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
D2L，Pytorch win10下使用dataloader时出现runtimeerror: dataloader worker (pid(s) ) exited unexpectedly的解决方案
tiyloving: 完美解决问题，我还需要减小batch_size
D2L，Pytorch win10下使用dataloader时出现runtimeerror: dataloader worker (pid(s) ) exited unexpectedly的解决方案
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

提示

确定要删除当前文章？

取消删除