pytorch减少精度提升速度、减少GPU内存

最新推荐文章于 2022-09-24 21:56:15 发布

MaXuwl

最新推荐文章于 2022-09-24 21:56:15 发布

阅读量1k

点赞数 2

分类专栏：杂记文章标签：深度学习 python

本文链接：https://blog.csdn.net/MaXumr/article/details/108212291

版权

杂记专栏收录该内容

9 篇文章 0 订阅

订阅专栏

转载请注明出处
个人博客:https://maxusun.github.io/

提高运算速度，减少GPU占用内存的方法有很多，其中减少精度的方法对大多数实验结果都没有太大影响。在这里使用Apex比使用pytorch的half靠谱多了.

Apex

Apex具体的介绍可以看这篇文章：基于Apex的混合精度加速

安装

如果直接使用pip install apex安装，可能在运行的时候得到下面的错误：

TypeError: Class advice impossible in Python3. Use the @Implementer class decorator instead

这时候你需要使用下面的方式安装：

pip uninstall apex
git clone https://www.github.com/nvidia/apex
cd apex
python setup.py install

使用方法

使用方法只有简单的三行代码：

from apex import amp
model, optimizer = amp.initialize(model, optimizer, opt_level="O1") # 这里是“欧一”，不是“零一”

# 下面两句替换源代码里面的loss.backward()
with amp.scale_loss(loss, optimizer) as scaled_loss:
    scaled_loss.backward()

多网络，bn同步，多卡等情况：

from apex import amp
(net,net_fc),optimizer = amp.initialize([net,net_fc], optimizer, opt_level= "O1")#这里多个net就用列表
with amp.scale_loss(loss_mean, optimizer) as scaled_loss:
scaled_loss.backward()
#bn同步
from apex.parallel import convert_syncbn_model
net = convert_syncbn_model(net)
net = net.to(device)
#多卡
from apex.parallel import DistributedDataParallel as DDP
net, opt = amp.initialize(net, opt, opt_level="O1")  # 字母小写o,不是零。
net = DDP(net, delay_allreduce=True)  # 必须在initialze之后