使用GPU训练大神经网络之显存控制策略与提升

最新推荐文章于 2023-05-30 10:58:28 发布

置顶

silent56_th

最新推荐文章于 2023-05-30 10:58:28 发布

阅读量7.3k

点赞数 5

分类专栏： Tensorflow 显存控制 Tensorflow使用技巧文章标签： Tensorflow 深度学习神经网络 GPU

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/silent56_th/article/details/80394399

版权

本文探讨了GPU显存控制策略，包括Live Analysis、Offloading & Prefetching和Recomputation，旨在优化深度神经网络训练。通过资源回收、数据传输优化和重计算，提高GPU内存利用率，降低训练复杂度。论文与Tensorflow、Caffe等框架的显存管理进行了对比，提出了动态显存控制策略的重要性。

摘要由CSDN通过智能技术生成

本文是“[PPoPP18] SuperNeurons:Dynamic GPU Memory Management for Training Deep Neural Networks”的论文阅读笔记，论文、talk视频PPT等详见作者主页：https://linnanwang.github.io/
参考资料：
https://linnanwang.github.io/
How to Optimize Data Transfers in CUDA C/C++
How to Overlap Data Transfers in CUDA C/C++
Memory Allocation Overhead
cudamalloc slow
vDNN: Virtualized Deep Neural Networks for Scalable, Memory-Efficient Neural Network Design
Training Deep Nets with Sublinear Memory Cost
Arbitrary 2D convolution
Fast Algorithms for Convolutional Neural Networks

GPU显存控制策略与提升

该论文对时下各个框架中显存控制的思想做了汇总，并做了一些技术上的提升。整体上分为三个部分：
1. Live Analysis：即资源回收，回收无用tensor的显存。
2. offloading&prefetching：将装不下的tensor暂存到内存等其他设备中。
3. Recomputation：对于占用显存多、计算消耗小的tensor，不进行存储，需要使用时重新计算。

1. Live Analysis

其思想主要是资源回收，对于后续操作不依赖的tensor进行回收，释放相应的显存空间。
关于如何分析依赖关系，笔者猜测应该有许多基于计算图的算法。论文中给出了一个简单的 O(N2)

最低0.47元/天解锁文章

关注

5
点赞
踩
12

收藏

觉得还不错? 一键收藏
3
评论
使用GPU训练大神经网络之显存控制策略与提升

本文是“[PPoPP18] SuperNeurons:Dynamic GPU Memory Management for Training Deep Neural Networks”的论文阅读笔记，论文、talk视频PPT等详见作者主页：https://linnanwang.github.io/ 参考资料： https://linnanwang.github.io/ How to Optim...
复制链接

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。