利用pytorch和torchvision以及cuda做深度学习的那些坑:
作为新手,通过自己配置python的库、虚拟环境要学习的真的很多。以前都是在windows电脑中,直接用一个环境搞定所有的训练。在安装torch和torchvision遭遇了各种不同的坑,填坑之旅真的是困难重重。
使用服务器时
-
使用pycharm新建项目时,不能调用conda创建的虚拟环境;
-
使用pycharm新建项目时,利用python自带的virtualenv创建的虚拟环境不能被conda搜索到;
-
但是自带的virtualenv创建的虚拟环境是可以使用的,于是就在这个虚拟环境上继续调试,于是出现了以下问题。
首先出现了以下界面,卡了很久:
卡完后,继续出现以下问题:
-
尝试查询该问题的解决方法:
由于没有管理员权限,但是这个是服务器,管理员权限很麻烦,我不想弄了。心好累啊。既然conda不行,那我就转而使用pip。
- 使用pip安装torch的话需要下载轮子(.whl)文件。
- 服务器的cuda版本是11.4,我需要的torch版本是可以是1.8.0+cu111,torchvision版本是0.9.0+cu111,同时python版本是3.8。轮子文件从以下网站下载: pytorch官网下载
- 然后使用pip install +文件的绝对路径 进行安装
至此,torch版本与cuda版本不兼容的问题终于解决了
重要提示:做图像深度学习的一定要按照顺序来配置cuda、pytorch等环境和库,安装cuda时按照该链接进行操作链接: 安装cuda详细步骤或: CUDA编程第一章:windows下安装visual studio 2019+CUDA10.2的整体图文流程
使用自己电脑时:
- 发现安装了torch和torchvision之后,使用以下代码,输出仍然是False。
print(torch.cuda.is_available())
我还以为是我torch和torchvision版本的问题。又卸载了这两个库。
但是在查询解决方案的途中,查到了网上的攻略,我跟着步骤一步一步来的时候,我发现我没有我通过在终端输入以下代码发现,我连CUDA都没有安装。
nvcc --version
-
于是又下载了11.4的CUDA。在安装的过程中,出现了以下问题:
显示我缺少Visual Studio,所以继续安装相应的软件,参考 CUDA编程第一章:windows下安装visual studio 进行相应的下载与安装。
-
但还是出现了问题:
真的太痛了。
-
我决定忽略Visual Studio安装,继续第二步的安装,结果依然不行:
查询相关解决方法后,需要我卸载与NVIDIA相关的程序。参考链接: CUDA安装卡在visual studio integration。
痛苦面具了属于是。 -
解决方案以后再写吧。 一定要按照步骤!