1、torch1.4的安装
刚开始用torch的时候,按照网上博客的教程,使用官网上的安装办法,安装的是应用在CUDA10.1上的torch1.4 ,即
2、torch.cuda.is_available()结果为false的错误
但是,最近在琢磨使用nn.DataParallel进行多GPU训练,可是,在运行的过程中,遇到了torch.cuda.is_available()结果为false的错误,即
可见,当模型代码使用了torch1.4的深度学习框架时,其没法使用gpu(因为cuda处于不可用状态),且torch1.4对应的CUDA版本是10.1。
3、查看服务器的cuda版本
这个时候,查看服务器的cuda版本,可得其版本为10.0,即
4、torch1.2对应的CUDA10.0
可以发现服务器的CUDA是10.1,而我们安装的torch1.4对应的CUDA是10.1,从中可以看出CUDA不对照的问题,因此,我们安装适用于cuda10.0的相应版本的torch1.2,使用如下代码安装即可:
conda install pytorch==1.2.0 torchvision==0.4.0 cudatoolkit=10.0
安装完成后,结果如下:
5、PyTorch1.2下 CUDA安装验证程序
重新运行测试代码,进行验证,表明使用torch编写的代码可以使用服务器上的gpu,即