ubuntu RTX2080Ti pytorch使用fp16

本文介绍了在Ubuntu系统中,使用RTX2080Ti显卡配合PyTorch进行fp16训练的配置步骤和实际体验。通过apex库实现fp16,减少了显存占用并加快了速度,但可能影响模型准确度,且部分非官方模块不支持fp16。
摘要由CSDN通过智能技术生成

被安利了很久说2080ti下使用fp16可以提速而且几乎不影响效果,所以今天试着弄了一下,整体感觉是显存占用少很多,速度比较快,但是还是会影响准确度,而且一些非官方提供的模块使用起来不方便(因为不支持fp16)。这里记录一下安装过程和详细的使用体验,毕竟我金鱼记忆。

1. 配置apex

使用fp16,官方推荐用apex包。在安装apex时需要注意driver和cuda版本对应,不然可能会报错(顺便唠叨一句,以前感觉driver和cuda版本不对应影响不大,程序照样可以跑,但最近发现配置很多环境出错是它们版本不对应造成的)。然后按照apex官方提供的安装过程安装https://github.com/NVIDIA/apex。为了不影响速度,我选用了“installing Apex with CUDA and C++ extensions”,在conda环境下配置了pytorch1.0,我截的安装过程:

$ git clone apex
$ cd apex
$ pip install -v --no-cache-dir --global-option="--cpp_ext" --global-option="--cuda_ext" .

注意:pip install命令最后的“.”不要漏掉,这个表明在当前环境下操作。

 

遇到的错误:

(1)好象是cuda版本和driver版本不对应造成的,改了cuda后就可以了。(记得还要装对应cuda版本的pytorc

评论 14
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值