显存爆炸和pin_memory

最新推荐文章于 2023-11-06 23:51:21 发布

这个柚子有点酸

最新推荐文章于 2023-11-06 23:51:21 发布

阅读量9.2k

点赞数 10

本文链接：https://blog.csdn.net/qq_38331273/article/details/116308860

版权

参考：https://zhuanlan.zhihu.com/p/117270644

训练模型训练一半时显存爆炸的问题解决：

pin_memory：表示要将load进来的数据是否要拷贝到pin_memory区中，其表示生成的Tensor数据是属于内存中的锁页内存区，这样将Tensor数据转移到GPU中速度就会快一些，默认为False。

通常情况下，数据在内存中要么以锁页的方式存在，要么保存在虚拟内存(磁盘)中，设置为True后，数据直接保存在锁页内存中，后续直接传入cuda；否则需要先从虚拟内存中传入锁页内存中，再传入cuda，这样就比较耗时了，但是对于内存的大小要求比较高。

即，先把dataset读到CPU上，然后GPU只读每个batch的数据，这样gpu就不会报内存不足了。

综上：当训练模型训练到一半时出现显存爆炸可以尝试将dataloader中的pin_memory设置成False.

补充：

pytorch中dataloader一次性创建num_workers个子线程，然后用batch_sampler将指定batch分配给指定worker，worker将它负责的batch加载进RAM，dataloader就可以直接从RAM中找本轮迭代要用的batch。如果num_worker设置得大，好处是寻batch速度快，因为下一轮迭代的batch很可能在上一轮/上上一轮...迭代时已经加载好了。坏处是内存开销大，也加重了CPU负担（worker加载数据到RAM的进程是进行CPU复制）。如果num_worker设为0，意味着每一轮迭代时，dataloader不再有自主加载数据到RAM这一步骤，只有当你需要的时候再加载相应的batch，当然速度就更慢。num_workers的经验设置值是自己电脑/服务器的CPU核心数，如果CPU很强、RAM也很充足，就可以设置得更大些，对于单机来说，单跑一个任务的话，直接设置为CPU的核心数最好。

这个柚子有点酸

关注

10
点赞
踩
47

收藏

觉得还不错? 一键收藏
3
评论
显存爆炸和pin_memory

参考：https://zhuanlan.zhihu.com/p/117270644训练模型训练一半时显存爆炸的问题解决：pin_memory：表示要将load进来的数据是否要拷贝到pin_memory区中，其表示生成的Tensor数据是属于内存中的锁页内存区，这样将Tensor数据转移到GPU中速度就会快一些，默认为False。通常情况下，数据在内存中要么以锁页的方式存在，要么保存在虚拟内存(磁盘)中，设置为True后，数据直接保存在锁页内存中，后续直接传入cuda；否则需要先从虚拟内存中传入锁
复制链接

扫一扫