目录
写在前面:
- 强烈打call:👉Pytorch1.10安装记录(CUDA11.3)
虽然很大可能不会有人看,但是还是想说明一下,这篇博客只是我本人对一些环境配置参数的记录,不会有太大的参考价值,请见谅~
因为CUDA自动从11.4升级到11.6了,所以我重新安装了一下pytorch,将torch的版本号安装到了1.12.0
,torchvision的版本号安装到了0.13.0
重新安装pytorch遇到了几乎卡死的情况,有用的参考:
- 一定要选用管理员模式进入到虚拟环境去安装包
- 可以先手动将待安装的包下载下来,然后再安装:安装torch失败 2020-12-05
- 1.进入官网,按照需求下载torch、torchvision等(注意选择cpu还是gpu):https://download.pytorch.org/whl/torch_stable.html
- 2.用管理员模式打开cmd,然后运行下面命令:(引号里面需要指明该whl文件的路径,
-i
是采用指定网络可加速下载)
pip install ".\torch-1.7.0+cpu-cp38-cp38-win_amd64.whl" -i https://pypi.douban.com/simple
1. 我的电脑配置
Lenovo / 联想拯救者 R7000 R7-5800H / RTX 3050-4G / 512G 固态硬盘SSD / 16G 内存容量
中关村在线-详情介绍:联想拯救者R7000 2021(R7 5800H/16GB/512GB/RTX3050)
环境:Windows 10 家庭中文版
处理器:AMD Ryzen 7 5800H
显卡芯片:NVIDIA GeForce RTX 3050(容量:4GB)
NVCUDA64.DLL 30.0.14.7219 NVIDIA CUDA 11.4.141 driver
2. 已安装的环境参数
2.1 PyTorch(已删)
python == 3.7.11
pytorch == 1.10.2
torch == 1.10.2
opencv-contrib-python == 4.5.5.64
opencv-python == 4.5.5.64
tensorboard == 2.8.0
tensorboardx == 2.5
tensorflow == 2.4.0 (这里是为了安装tensorboard所以先安装了tensorflow,详见tensorboard初体验)
torchvision == 0.11.3
tqdm == 4.63.0
2.2 yolov5(基于PyTorch的)
python == 3.8.5
cuda == 11.3
cudnn == 8.4.1
labelme == 4.5.13
labelImg == 1.8.6
torch == 1.10.0+cu113
torchvision == 0.11.1+cu113
opencv-python == 4.6.0.66
tensorboard == 2.8.0
tqdm == 4.64.0
查看cuda版本号:在cmd中键入:nvcc --V
即可
查看cudnn版本号:
需要进入到安装CUDA的目录中的include
文件夹去寻找cudnn_version.h
文件(我更改了安装位置所以未安装到C盘)
- CUDA的安装目录:
D:\SoftWareInstallMenu\CUDA11_6_manager\NVIDIA GPU Computing Toolkit\CDUA\v11.3\include
- 找到
cudnn_version.h
文件,将这3行数字拼在一起即可。例如我的就是:8.4.1
2.3 tensorflow(不会常用了)
python == 3.7.11
opencv-python == 4.5.5.64
tensorboard == 2.6.0
tensorflow-gpu == 2.4.0
3. 参考的安装教程
1、RTX3050ti、3060等系列显卡正确安装cuda、cudnn,配置Pytorch深度学习环境(避免由于版本不适应导致重装)
- 打开pytorch官网根据版本需求选择适合的pytorch版本:https://pytorch.org/get-started/locally/
- 进入cuda安装官网:https://developer.nvidia.com/cuda-toolkit-archive
- 进入cudnn官网下载地址:https://developer.nvidia.com/cudnn (这里需要注册账号并填写相关个人信息,然后进才可以进入真正的下载页面,按照提示一步步操作即可。)
2、自己写的(乱乱的):Anaconda-Tensorflow-PyTorch-GPU配置流程
3、B站教学视频:【包教包会】Anaconda+Cuda+Cudnn+TensorFlow+Pytorch+Pycharm+Win10深度学习环境配置
4. 一些命令
(1) 在cmd中输入命令开始搭建环境
conda create –n tensorflow python=3.7 # 通常选择3.7版本
(2) 加上豆瓣源,快速安装一些包(用包名替换掉[module name]
即可)
先cmd
,再activate PyTorch
进入到PyTorch环境。
pip install [module name] -i http://pypi.doubanio.com/simple/ --trusted-host pypi.doubanio.com
(3) 卸载包
先cmd
,再activate PyTorch
进入到PyTorch环境。
pip uninstall [module name]
(4) 验证该环境下gpu和cuda组合是否可用
记得将yolov5
换成待验证的环境。
activate yolov5
python
import torch
torch.zeros(1).cuda()
# 如果没有报错,表示可用,至此大功告成,在以后的项目中,就可以使用gpu来跑程序啦。
(5) 测试一下cuda是否安装成功
打开cmd
命令终端(不用进入到某一环境),然后输入命令:
nvcc -V # 不报错,且显示cuda版本号 v11.3
(6) 查看显卡版本号
方法1:进入NVIDIA控制面板查看
很奇怪,过了4个月后,我的CUDA版本自动升级到11.6了
方法2:在cmd
中输入以下命令
nvidia-smi
(7) 在 任意 conda环境下查看 所有 conda环境
如果想直观的看所有conda environment以及各环境中已安装的package和版本号,就直接进入到Anaconda中去查看。
当前所处环境前带有*
。
conda info -envs
(8) 查看某环境中的某个package的版本号
例如在yolov5环境中查看torch的版本号。依次在cmd
中输入:
activate yolov5
python
import torch
torch.__verion__ # 1.8.0
(9) 退出python编写环境的命令:exit()
5. opencv
opencv有点问题,就参照这篇文章找到了解决办法: