【深度学习基础】Pytorch 半精度（混合精度 AMP）训练

最新推荐文章于 2025-03-02 20:23:02 发布

wonder_if_

最新推荐文章于 2025-03-02 20:23:02 发布

阅读量1k

点赞数 6

文章标签：深度学习 pytorch 人工智能 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42200733/article/details/140682379

版权

混合精度训练，使用半精度加速训练

为什么要选择混合精度

深度学习在训练阶段往往操作一系列浮点值进行运算，而受制于显卡的有限计算单元，计算不同规格的浮点数的效率截然不同（例如计算一个32位浮点数的单元可以拆分为两个计算16位浮点数的单元），因此选择更低精度的浮点数将会带来巨大的效率提升。

下图为A100在不同进度下的性能：
在这里插入图片描述
在训练的过程中，中间参数的精度需求实际并不高，我们可以牺牲一部分精度来换取更快的学习速度和更少的显存占用。

尽管使用FP16（或TF16）可以带来显著的效率和内存优势，‌但它也面临一些挑战，‌如精度溢出和舍入误差。‌为了解决这些问题，‌通常在前向和反向传播过程中使用FP16，‌而在累积梯度和更新模型参数时使用FP32（Ampere架构后为TF32），‌以保证数值稳定性和精度。‌这种做法在保持计算精度的同时，‌也提高了计算效率和减少了内存占用。‌

混合精度训练

Pytorch 中，autocast 可以十分方便的开启混合精度计算。
为防止下溢或溢出，还需使用 GradScaler 对梯度进行适当缩放来适应半精度浮点数的范围。

导入GradScaler 和 autocast：

from torch

最低0.47元/天解锁文章

博客等级

码龄7年

13
原创

136
点赞

168
收藏

96
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

【论文阅读】【代码阅读】视觉语言模型（VLMs）之 CLIP
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文笔记】Deep Spectral Clustering With Constrained Laplacian Rank（DSCCLR）
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
[论文笔记] The Pursuit of Human Labeling: A New Perspective on Unsupervised Learning
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
Java实现线性表之顺序表
wonder_if_: @CSDN-Ada助手
论文笔记：Category Contrast for Unsupervised Domain Adaptation in Visual Tasks【无监督域自适应】
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。