混合精度训练——资料+简单说明

最新推荐文章于 2024-08-02 22:56:55 发布

MoonLer

最新推荐文章于 2024-08-02 22:56:55 发布

阅读量513

点赞数

分类专栏： NLP deeplearning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40240102/article/details/103215860

版权

deeplearning 同时被 2 个专栏收录

53 篇文章 6 订阅

订阅专栏

32 篇文章 1 订阅

订阅专栏

序

最近看CDQA这个开源库的时候看到了混合精度训练这种写法，所以简单去了解了下，
结果得出了一个很悲催的结论：我的小破笔记本的显卡不支持混合精度训练…？？！
自己不研究这个，找到一些很不错的资料，自己看完后这里就奉送上！

Tensor Core

-----------------------------大神自取-----------------------------
1. Deep Learning Performance Guide

2. 想读读PyTorch底层代码？这份内核机制简介送给你

3. 如何轻松了解深度学习模型中使用了混合精度？

本着扩充知识的目的，我们来简单普及一些关于显卡的知识，虽然买不起…

GPU参数解释

自取

体现GPU计算能力的两个重要特征：
1)CUDA核的个数；
2)存储器大小。
描述GPU性能的两个重要指标：
1)计算性能峰值；
2)存储器带宽。

GPU，CUDA，cuDNN的理解

略读：
补：cuDNN将研究人员创建和优化CUDA代码以提高DL性能的需求抽象出来

GPU选择（土豪自取）

做深度学习这么多年还不会挑GPU？这儿有份选购全攻略

GPU正篇

上面其实是为下面的两篇文章稍微打打基础,简单看看，可以当作普及知识，两篇文章大致从GPU硬件角度出发，解释的混合精度训练和一些测试结果：
2.NVIDIA深度学习Tensor Core全面解析（上篇）
3.NVIDIA深度学习Tensor Core全面解析（下篇）

基于混和精度的模型加速

本这篇文章重在工程化，给出了具体的代码以及下面的相应的参考资料,这几份参考资料都很不错，看完上面的博文，有需要可以仔细读读下面的资料

参考资料：

1.nv官方repo给了一些基于pytorch的apex加速的实现

实现是基于fairseq实现的，可以直接对比代码1-apex版和代码2-非apex版(fairseq官方版)，了解是如何基于apex实现加速的。

2.nv官方关于混合精度优化的原理介绍

按图索骥，可以get到很多更加具体地内容。

3.低精度表示用于深度学习训练与推断： pdf介绍，很不错

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。