笔记本WIN10+GTX1650配置tensorflow-gpu2.2.0(利用anaconda命令安装cuda和cudnn
概览
这篇文是我这个菜鸟配置完环境过程的记录,其中包含了配置的详细步骤以及过程中遇到的问题。
记录一下我的第一次配置经过。
硬件配置:i7-10750h+4G GTX1650
软件配置:anaconda3-5.1.0+visual studio 2015+tensorflow-gpu2.2.0+cudatoolkit10.1+cudnn7.6.5
确定适合自己的cuda和cudnn版本,看安装中的“三”
具体安装步骤
一、安装anaconda
(一)下载anaconda安装包进行安装(我的版本anaconda3-5.1.0):
1. 如果电脑上已安装了python环境的话,建议先卸载。
2. anaconda安装步骤如下
- 我自定义的路径是D盘(目前无其他问题),如果C盘够大的话,保险起见可以装在C盘,以免后续有其他问题
- 我是两个都打勾,第一个是将anaconda的环境加到系统环境变量里;第二个是给anaconda安装python3.6(对于第二个勾选我也是存疑惑的,因为后边我在创建环境时又安装了3.7版本也无影响)
- 点击图中红框
- 两个勾选可取消
(二)安装anaconda时出现的问题及解决
1.点击VSCode提示Please make sure you are connected to the internet!
- 解决办法如下:先点击中止,不用关闭安装界面,然后完成以下步骤后,再次install VSCode
- 第一步:在anaconda目录下找到文档vscode_inst.py,大概路径:/anaconda3/pkgs/vscode_inst.py
- 第二步:打开文件,修改代码并保存
- 找到以下代码(110行左右)
VSCODE_ENDPOINT = 'https://vscode-update.azurewebsites.net/api/update/{}/stable/version'.format(VSCODE_SUBDIR) # NOQA
- 改为以下代码:
VSCODE_ENDPOINT = 'https://update.code.visualstudio.com/api/update/{}/stable/version'.format(VSCODE_SUBDIR) # NOQA
- 找到代码(142行左右)
`r = requests.head(VSCODE_ENDPOINT, timeout=5)`
- 改为以下代码:
r = requests.head(VSCODE_ENDPOINT, timeout=5, allow_redirects=True)
二、安装visual studio
(一)下载安装包进行安装(我:visual studio2015)
- 以管理员身份运行setup.exe
- 在下图步骤中,路径可不是C盘。安装类型我选择的是默认,对跑yolov4网络无影响。
(选择自定义的话是选择安装的组件功能,选择的功能越多占用内存也越大。)
(二)暂无问题
三、根据“自身显卡”+“所需的tensorflow版本”选择匹配的cuda和cudnn
-
确认gpu算力,确认是否可以使用cuda加速(我只截取了部分,其他大家可去官网查看)
-
找到你所需tensorflow-gpu版本对应的cuda和cudnn
-
确认你的显卡能够安装上个步骤中的cuda版本
1.桌面右键,打开NVIDIA控制面板
2.界面上方帮助—>系统信息–>界面上方的组件–>查看cuda driver
选择安装的cuda版本号 << 显示的dll版本cuda10.1及以下版本较稳定
- 确认cuda版本与cudnn适配https://developer.nvidia.com/rdp/cudnn-archive#a-collapse742-10
四、安装cuda10.1,cudnn7.6.5和tensorflow-gpu 2.2.0
(一)使用conda命令安装cuda10.1和cudnn7.6.5
-
在开始菜单找到并打开anaconda prompt
-
输入以下代码创建虚拟环境,新建一个python3.7的环境,命名为yolo
conda create -n yolo python=3.7
- 进入创建的conda环境
conda activate yolo
- 输入以下代码,安装cuda和cudnn(可更改等号后的数字指定版本号)
conda install cudatoolkit=10.1 cudnn=7.6.5
(二)使用pip安装tensorflow-gpu2.2.0
- 相同环境中输入以下代码,安装tensorflow-gpu 2.2.0(可更改等号后的数字指定版本号)
pip install tensorflow-gpu==2.2.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
(三)安装说明
1.说明:可更改上述代码等号后的数字,指定安装所需版本
2.检查是否安装成功(是否成功调用GPU)
import tensorflow as tf
print("Num GPUs Available: ", len(tf.config.experimental.list_physical_devices('GPU')))
3.临时换源提速
pip --default-timeout=100 install 库名称 -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com
清华:https://pypi.tuna.tsinghua.edu.cn/simple
阿里云:http://mirrors.aliyun.com/pypi/simple/
中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/
华中科技大学:http://pypi.hustunique.com/
山东理工大学:http://pypi.sdutlinux.org/
豆瓣:http://pypi.douban.com/simple/
五、yolo代码报错问题
-
训练yolo模型发现缺少dll
1.在anaconda的安装目录下Anaconda3\envs\YOLOV4\Library\bin 可找到所缺文件
2.将缺少dll文件复制到C:\Windows\System32中
3.(这一点很重要) 只要缺少cublas64_10.dll,必须将cublasLt64_10.dll和cublas64_10.dll一起复制到C:\Windows\System32 -
运行代码时,若报错"no module named xxx",搜索报错即可知安装什么库。
这只是一个记录帖,欢迎大家在评论中讨论,希望能和大家多多交流!