混合精度训练——资料+简单说明

  • 最近看CDQA这个开源库的时候看到了混合精度训练这种写法,所以简单去了解了下,
  • 结果得出了一个很悲催的结论:我的小破笔记本的显卡不支持混合精度训练…??!
  • 自己不研究这个,找到一些很不错的资料,自己看完后这里就奉送上!

Tensor Core

-----------------------------大神自取-----------------------------
1. Deep Learning Performance Guide

2. 想读读PyTorch底层代码?这份内核机制简介送给你

3. 如何轻松了解深度学习模型中使用了混合精度?


  • 本着扩充知识的目的,我们来简单普及一些关于显卡的知识,虽然买不起…

GPU参数解释

体现GPU计算能力的两个重要特征:
​ 1)CUDA核的个数;
​ 2)存储器大小。
描述GPU性能的两个重要指标:
​ 1)计算性能峰值;
​ 2)存储器带宽。

GPU,CUDA,cuDNN的理解

  • 略读:

  • 补:cuDNN将研究人员创建和优化CUDA代码以提高DL性能的需求抽象出来

GPU选择(土豪自取)

GPU正篇

基于混和精度的模型加速

原始博文

  • 本这篇文章重在工程化,给出了具体的代码以及下面的相应的参考资料,这几份参考资料都很不错,看完上面的博文,有需要可以仔细读读下面的资料

参考资料:

1.nv官方repo给了一些基于pytorch的apex加速的实现

2.nv官方关于混合精度优化的原理介绍

  • 按图索骥,可以get到很多更加具体地内容。

3.低精度表示用于深度学习 训练与推断: pdf介绍,很不错

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值