混合精度与单精度对比

使用混合精度代码更改很少
 

scaler = GradScaler()


with autocast():
    out = model(data)
    loss = loss_func(out, target)
scaler.scale(loss).backward()
scaler.step(opt)
scaler.update()


只有PASCAL架构显卡

CIFAR1000最大批次
TITAN X PASCAL 12G
单精度batch=3100 混合精度batch=5000  批次大小提升61%倍
GTX1070 8G
单精度batch=2000 混合精度batch=2900  批次大小提升45%倍

CIFAR1000速率测试
batch=2500
TITAN X PASCAL 12G
单精度 15.47s/batch  混合精度 22.8秒/bitch  速率变慢了47%
GTX1070 8G
单精度 18.13s/batch  混合精度 29.6秒/bitch  速度变慢了63%

显存不够可以试试混合精度,PASCAL架构显卡混合精度更慢,有tensor core显卡应该可以加速。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值