【pytorch】基于Apex的混合精度加速

最新推荐文章于 2024-06-03 14:30:52 发布

行*云

最新推荐文章于 2024-06-03 14:30:52 发布

阅读量1.6k

点赞数 2

分类专栏：深度学习

本文链接：https://blog.csdn.net/qq_34795071/article/details/103539168

版权

深度学习专栏收录该内容

34 篇文章 7 订阅

订阅专栏

双倍训练速度，双倍的快乐，简单记录Nvidia开发的基于PyTorch的混合精度训练加速神器--Apex，可以用短短三行代码就能实现不同程度的混合精度加速，训练时间直接缩小一半

三行代码搞定：

from apex import amp
model, optimizer = amp.initialize(model, optimizer, opt_level="O1") # 这里是“欧一”，不是“零一”
with amp.scale_loss(loss, optimizer) as scaled_loss:
    scaled_loss.backward()

opt_level:

代码中只有一个opt_level需要用户自行配置：

O0：纯FP32训练，可以作为accuracy的baseline；
O1：混合精度训练（推荐使用），根据黑白名单自动决定使用FP16（GEMM, 卷积）还是FP32（Softmax）进行计算。
O2：“几乎FP16”混合精度训练，不存在黑白名单，除了Batch norm，几乎都是用FP16计算。
O3：纯FP16训练，很不稳定，但是可以作为speed的baseline；

参考链接：https://nvidia.github.io/apex/amp.html

行*云

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
【pytorch】基于Apex的混合精度加速

双倍训练速度，双倍的快乐，简单记录Nvidia开发的基于PyTorch的混合精度训练加速神器--Apex，可以用短短三行代码就能实现不同程度的混合精度加速，训练时间直接缩小一半三行代码搞定：from apex import ampmodel, optimizer = amp.initialize(model, optimizer, opt_level="O1") # 这里是“欧...
复制链接

扫一扫