【pytorch】一个函数帮你找到合适的 batch_size

最新推荐文章于 2023-09-15 10:31:00 发布

x66ccff

最新推荐文章于 2023-09-15 10:31:00 发布

阅读量636

点赞数

分类专栏： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_18846849/article/details/127860520

版权

pytorch batch 深度学习

python 专栏收录该内容

42 篇文章 2 订阅

订阅专栏

训练模型时，使用什么 batch_size 能够帮我们最大化利用 GPU 的性能？
给你一个函数，帮助你快速找到合适的 batch_size！
参考：原文链接

函数定义

import time
def proc_time(b_sz, model, n_iter=10):
    # 模型输入部分
    x = torch.rand(b_sz, 16, 11).cuda()  # <----- 在这里设置输入的形状 
    
    torch.cuda.synchronize()
    start = time.time()
    for _ in range(n_iter):
        model(x)                         # <---- 模型输入
    torch.cuda.synchronize()
    end = time.time() - start
    throughput = b_sz * n_iter / end
    print(f"Batch: {b_sz} \t {throughput} samples/sec")
    return (b_sz, throughput, )

函数调用

for b_sz in [1, 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024, 2048]:
    proc_time(b_sz, model)

Batch: 1 	 	16.793156063735697 samples/sec
Batch: 2 	 	38.83115043526805 samples/sec
Batch: 4 	 	77.96799714472667 samples/sec
Batch: 8 	 	153.83649638382983 samples/sec
Batch: 16 	 	304.7619878029563 samples/sec
Batch: 32 	 	600.1129780317017 samples/sec
Batch: 64 	 	1350.1580643181849 samples/sec
Batch: 128 	 	2644.7298943577844 samples/sec
Batch: 256 	 	5297.651717512998 samples/sec
Batch: 512 	 	9337.831389005929 samples/sec
Batch: 1024 	 14020.95845977864 samples/sec
Batch: 2048 	 16672.3204029026 samples/sec

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

x66ccff CSDN认证博客专家 CSDN认证企业博客

码龄10年

162: 原创

9397: 周排名

1万+: 总排名

27万+: 访问

: 等级

2787: 积分

655: 粉丝

934: 获赞

49: 评论

1273: 收藏

私信

关注

热门文章

分类专栏

linux 19篇
电脑维修 7篇
物理 2篇
NLP 10篇
专家系统 2篇
python 42篇
数学 12篇
数据库 1篇
图网络 1篇
最优化 1篇
机器学习 12篇
强化学习 8篇
爬虫
多模态 2篇

最新评论

【NLP】Bi-LSTM 进行机器翻译
wu_solo: 能把源代码发出来吗？
【搬运】GSM8K 数据集介绍
chduan_10: wget https://github.com/open-compass/opencompass/releases/download/0.2.2.rc1/OpenCompassData-core-20240207.zip
【搬运】GSM8K 数据集介绍
马上猴: GSM8K这个数据集能不能下载到本地，网上都是python代码的形式
【NLP】LSTM 唐诗生成器
m0_75104450: 想请问下在一开始的数据集中是否不包括author这一项，我在复现代码的时候，会出现KeyError: 'paragraphs'的问题，应该是因为author这一个文件，想问下一开始的文件包括哪些
【VAE】利用 MNIST 训练 VAE 模型，并对潜空间进行可视化
--吉择--: 因为 KL 散度通常是负数，所以当计算 KL 散度并将其添加到重建损失中时，整体损失可能会呈现负值。当然，损失为负并不一定意味着出现了问题，只要在训练过程中损失保持稳定并收敛，模型的训练就是有效的。

最新文章

2024

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。