EMA和自动混合精度（AMP）

xx_xjm

已于 2022-02-16 18:31:02 修改

阅读量771

点赞数

分类专栏： CV笔记文章标签： pytorch 深度学习 transformer

于 2022-02-16 18:26:46 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xx_xjm/article/details/122966411

版权

CV笔记专栏收录该内容

62 篇文章 1 订阅

订阅专栏

本文介绍了两种用于优化深度学习模型训练的技术：指数移动平均(EMA)和自动混合精度(AMP)。EMA通过平滑权重更新来提升模型稳定性，而AMP则利用FP16精度加速训练过程，同时通过GradScaler确保数值稳定性。这两个技术能够有效提高模型训练效率和性能。

摘要由CSDN通过智能技术生成

EMA:指数移动平均，用于优化权重更新

参考自：https://blog.csdn.net/Newt_Scamander/article/details/122268929

AMP：自动混合精度，用于加快模型训练，其思想在于使得模型处理数据的时候，自动控制数据在torch.FloatTensor和torch.HalfTensor之间变换。

涉及到AMP有两个函数需要注意：

1：torch.cuda.amp.autocast：自动将数据从FP32转化为FP16，一般只用于前向传播。

2：torch.cuda.amp.GradScaler

参考自：https://blog.csdn.net/ytusdc/article/details/122152244

https://blog.csdn.net/djfjkj52/article/details/114963916

https://www.cnblogs.com/jimchen1218/p/14315008.html

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

xx_xjm CSDN认证博客专家 CSDN认证企业博客

码龄4年

88: 原创

32万+: 周排名

25万+: 总排名

12万+: 访问

: 等级

1089: 积分

42: 粉丝

124: 获赞

20: 评论

333: 收藏

私信

关注

热门文章

分类专栏

pytorch扩展 1篇
CV笔记 62篇
c++笔记 3篇
NLP笔记 1篇

最新评论

torch.distributed补充
destiny44123: 加req也不对，这里看上去对是因为你传输的tensor太小；本质上isend和irecv都是异步操作，接收端在访问前应调用wait方法。
pytorch分布式训练
jxqbuct: isend得有返回值，然后wait就行了
pytorch自定义forward和backward函数
xx_xjm: 不是吧，函数有几个输入，反传就应该有几个，输入等于自变量，求导等于求偏导吧！！
pytorch自定义forward和backward函数
过◎往: 应该是前向return了几个参数 backward要对这几个参数求导吧
Coco数据集中的rle格式处理
努力学习的双鱼: 你的demo显示也是0，哎

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。