【深度学习】BS与GPU显存的关系

sdbhewfoqi

已于 2024-08-13 13:37:12 修改

阅读量88

点赞数 3

分类专栏：深度学习文章标签：深度学习人工智能

于 2024-08-13 13:36:18 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_31866177/article/details/141161737

版权

深度学习专栏收录该内容

66 篇文章 14 订阅

订阅专栏

参考链接：https://blog.csdn.net/lien0906/article/details/78863118

问题：

tensorflow/core/common_runtime/bfc_allocator.cc:661] Chunk at 0x523cd7d00 of size 2048

tensorflow/core/common_runtime/bfc_allocator.cc:661] Chunk at 0x523cd8500 of size 9437184

tensorflow/core/common_runtime/bfc_allocator.cc:661] Chunk at 0x5245d8500 of size 2048

解决：尝试降低网络的深度和宽度、batch size 的大小

深度学习中神经网络的显存占用，我们可以得到如下公式：

显存占用 = 模型显存占用 + batch_size × 每个样本的显存占用

时间更宝贵，尽可能使模型变快（减少 flop）

显存占用不是和 batch size 简单成正比，模型自身的参数及其延伸出来的数据也要占据显存

batch size 越大，速度未必越快。在你充分利用计算资源的时候，加大 batch size 在速度上的提升很有限。

尤其是 batch-size，假定 GPU 处理单元已经充分利用的情况下：

增大 batch size 能增大速度，但是很有限（主要是并行计算的优化）
增大 batch size 能减缓梯度震荡，需要更少的迭代优化次数，收敛的更快，但是每次迭代耗时更长。
增大 batch size 使得一个 epoch 所能进行的优化次数变少，收敛可能变慢，从而需要更多时间才能收敛（比如 batch_size 变成全部样本数目）

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
【深度学习】BS与GPU显存的关系

增大 batch size 使得一个 epoch 所能进行的优化次数变少，收敛可能变慢，从而需要更多时间才能收敛（比如 batch_size 变成全部样本数目）参考链接：https://blog.csdn.net/lien0906/article/details/78863118。显存占用不是和 batch size 简单成正比，模型自身的参数及其延伸出来的数据也要占据显存。显存占用 = 模型显存占用 + batch_size × 每个样本的显存占用。时间更宝贵，尽可能使模型变快（减少 flop）
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。