PyTorch训练加速技巧

最新推荐文章于 2025-03-15 17:47:56 发布

原创

最新推荐文章于 2025-03-15 17:47:56 发布 · 1.9k 阅读

·

9

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

PyTorch训练加速技巧

由于最近的程序对速度要求比较高，想要快速出结果，因此特地学习了一下混合精度运算和并行化操作，由于已经有很多的文章介绍相关的原理，因此本篇只讲述如何应用PyTorch实现混合精度运算、数据并行和分布式运算，不具体介绍原理。

混合精度

自动混合精度训练（auto Mixed Precision，AMP）可以大幅度降低训练的成本并提高训练的速度。在此之前，自动混合精度运算是使用NVIDIA开发的Apex工具。从PyTorch1.6.0开始，PyTorch已经自带了AMP模块，因此接下来主要对PyTorch自带的amp模块进行简单的使用介绍。

## 导入amp工具包 
from torch.cuda.amp import autocast, GradScaler

model.train()

## 对梯度进行scale来加快模型收敛，
## 因为float16梯度容易出现underflow（梯度过小）
scaler = GradScaler()

batch_size = train_loader.batch_size
num_batches = len(train_loader)
end = time.time()
for i, (images, target) in tqdm.tqdm(
    enumerate(train_loader), ascii=True, total=len(train_loader)
):
    # measure data loading time
    data_time.update(time.time() - end)
    optimizer.zero_grad()
    if args.gpu is not None:
        images = images.cuda(args.gpu, non_blocking=True)

    target = target.cuda(args.gpu, non_blocking=True)
    # 自动为GPU op选择精度来提升训练性能而不降低模型准确度
    with autocast():
    # compute output
        outpu

最低0.47元/天解锁文章

好名字可以让朋友..更容易记住你

博客等级

码龄10年

11
原创

21
点赞

29
收藏

24
粉丝

关注

私信

热门文章

分类专栏

上一篇：: 如何在服务器上完全离线配置CUDA环境

下一篇：: torch.nn.Unfold函数的一些踩坑

最新评论

利用MindSpore复现ICCV2021 Best Paper Swin Trasnformer
帅次: 学习一下，支持！我的博客现在急需100来个评论，麻烦各位大佬到我主页的随便一篇文章写写评论，不胜感激！各位发大财！
MindSpore如何实现自定义训练
neu-gwh: ASCEND910环境，mindspore版本1.3，貌似只有1.3版本会报错，1.2不会
MindSpore如何实现自定义训练
neu-gwh: 我现在想用您的代码对LSTM模型做一个梯度裁剪，但是会报下面的错误，您知道原因吗 RuntimeError: mindspore/ccsrc/backend/optimizer/ascend/format_type/check_consistency.cc:85 Process] Found inconsistent format or data type! Op: Adam[kernel_graph_0:[CNode]53{[0]: ValueNode<Primitive> Adam, [1]: [CNode]53, [2]: [CNode]53, [3]: [CNode]53, [4]: [CNode]54, [5]: [CNode]54, [6]: [CNode]55, [7]: ValueNode<Tensor> Tensor(shape=[], dtype=Float32, value= 0.9), [8]: ValueNode<Tensor> Tensor(shape=[], dtype=Float32, value= 0.999), [9]: ValueNode<Tensor> Tensor(shape=[], dtype=Float32, value= 0.001), [10]: [CNode]56, [11]: [CNode]57}] # In file /home/archiconda3/envs/wks/lib/python3.7/site-packages/mindspore/nn/optim/adam.py(164) success = F.depend(success, opt(param, moment1, moment2, beta1_power, beta2_power, lr, beta1, beta2,
PyTorch训练加速技巧
自由学者亻伊宸: 还可以这样？秀！支持博主，大佬有兴趣也可以看下我的博客，说不定有收获哦~
PyTorch训练加速技巧
看，月亮在跳舞: 代码之路任重道远，愿跟博主努力习之。

大家在看

最新文章

目录

展开全部

收起

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。