提要
- 目录即步骤!
- 安装的是 torch 2.0 (小节4.3.1),听说它有加速效果,但是对于windows,torch. compile (model) 这个语句会报错,我网上搜索的原因是 没有适配 windows。
1.显卡信息查看
1.1 在电脑上直接查看
(1) 方法1: 设备管理器 -> 显示器适配器
显卡型号
(2) 方法2: 右键 -> 英伟达控制面板
显卡型号+版本号
1.2 在 cmd 中查看
(1)nvidia-smi
显卡型号+版本号+cuda版本
(2)nvcc -V
cuda 信息
安装详见 小节 3.cuda & cudnn 安装
2.anaconda 安装
官网: https://www.anaconda.com/products/individual
下载安装就完事儿了
3. cuda & cudnn 安装
关键在于 显卡驱动、cuda、cudnn、torch (或 tensorflow) 四者的版本要对上!!!
- 提示:①先看看自己的显卡型号,②根据显卡版本确定对应的 cuda,③根据cuda确定 cudnn、torch 版本
3.1 CUDA 安装
下载地址:
https://developer.nvidia.com/cuda-toolkit-archive
- 查看 cuda & 与显卡驱动 对应的关系:
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
3.2 cudnn 安装
(1) 下载地址:
https://developer.nvidia.com/rdp/cudnn-archive
可以看到 cudnn & CUDA 的版本对应关系。
(2)拷贝子文件夹(形如:bin, include, lib 等)放到cuda安装目录下(C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8)
(3) 编辑环境变量
-
CUDA_PATH
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8
一般而言,装好cuda后CUDA_PATH已经存在 -
CUDA_BIN_PATH
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\bin -
CUDA_LIB_PATH
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\lib\x64 -
CUDA_SDK_PATH
C:\ProgramData\NVIDIA Corporation\CUDA Samples\v11.8 -
CUDA_SDK_BIN_PATH
C:\ProgramData\NVIDIA Corporation\CUDA Samples\v11.8\bin\win64 -
CUDA_SDK_LIB_PATH
C:\ProgramData\NVIDIA Corporation\CUDA Samples\v11.8\common\lib\x64
3.3 安装错版本如何卸载
- 我们打开 “应用和功能” 搜索 nvidia 进行卸载:
对于含cuda字眼的,以及结尾有cuda版本号的可以卸载。
如果不确定那个程序能不能删除,可以百度看看,程序什么用途的。
NVIDIA的软件一个个都有其独立卸载程序,不用担心卸载顺序。
留下:NVIDIA的图形驱动程序、NVIDIA Physx系统软件,NVIDIA GeForce Experience(如果你有这3个软件,就别卸载)。
卸载:
1.推荐排序。 点击顶部时间小三角排序,可发现一个叫NVIDIA Nsight HUD Launcher 的带眼睛图标的排列在较前面。然后从下往上卸载,跳过 NVIDIA图形驱动、NVIDIA Physx系统软件、NVIDIA GeForce Experience。
2.软件名含cuda的,或者版本号的(如 11.8),或者SDK,以及 NVIDIA Nsight HUD等,这些都可以卸载掉。
3.卸载完后,你会发现电脑—开始—所有程序,里面那个关于NVIDIA的程序文件不见了。存在的话,也可以看看里面还剩下什么,可以搜索看看。当然,C盘里面C:\Program Files\NVIDIA GPU Computing Toolkit文件也可以删除了。
4.清理下电脑,主要是清理注册表
4. python 安装
打开 anaconda powershell promt 终端 在里面输入相关命令。具体如下:
4.1 conda 创建新python环境
conda create --name <env_name> python=<py_version>
-
需要自己填写的参数
<env_name>: 环境名称 形如 py3_6_ tf_gpu、py3_10_torch_2_0 等
<py_version>: python 版本号 -
验证:
conda info -e 命令可以查看 环境名称 与 安装位置 -
进入环境(也可切换环境):
conda activate <env_name> -
退出环境(回到 base):
conda deactivate
4.2 更多 conda 命令
- 删除环境
conda remove -n <env_name> --all - 查看库
conda list - 克隆环境
conda create -n <new_env_name> --clone <orig_env_name>
4.3 拓展阅读
4.3.1 python 各版本差异
https://blog.csdn.net/qq_35952638/article/details/103101820
5.python 库安装
conda activate <env_name> 进入环境后
5.1查看已安装的库
conda list
5.2下载库
pip install <module_name> -i <url_http>
-
注:
<module_name> : 库名 形如 numpu
<url_http> : 镜像站网址 (也可不要 -i <url_http> 如果科学上网的话) -
镜像站地址
http://pypi.douban.com/simple/ 豆瓣
http://mirrors.aliyun.com/pypi/simple/ 阿里
http://pypi.hustunique.com/simple/ 华中理工大学
http://pypi.sdutlinux.org/simple/ 山东理工大学
http://pypi.mirrors.ustc.edu.cn/simple/ 中国科学技术大学 -
tips
网站一般用 http 而非 https 后者有加密, 下载库可能报错 -
延申阅读
(1)Conda创建新环境
(2)解决:CondaHTTPError: HTTP 000 CONNECTION FAILED for url <https://repo.anaconda.com/pk gs/main/win-64/c
简述: 这个报错 需要改 .condarc文件 的内容: 替换 https -> http
该文件的路径形如 C:\Users\xxxx\.condarc
5.3 常用的库
5.3.1 torch (注意 torch & cuda 版本)
-
查看 torch & cuda 版本关系
(1) https://pytorch.org/get-started/previous-versions/
(2) https://gitcode.net/mirrors/pytorch/vision?utm_source=csdn_github_accelerator -
安装 torch 2.0 - 注意 显卡(>=452.39)&cuda(11.8.x)&cudnn(v8.9.0) 是否支持 !!!
pip install torch==2.0.0+cu118 torchvision==0.15.1+cu118 -f https://download.pytorch.org/whl/torch_stable.html --trusted-host=pypi.python.org --trusted-host=pypi.org --trusted-host=files.pythonhosted.org
-
参考文章: https://zhuanlan.zhihu.com/p/614624869
-
延申阅读
(1)PyTorch 2.0 重磅发布:一行代码提速 30%
5.3.2 tensorflow
6. 编译器安装
6.1 vscode (推荐)
6.1.1 app下载
官网下载安装即可
6.1.2 扩展工具下载
打开vscode -> 点击左侧扩展图标(几个方块) -> 搜索python -> 下载扩展
6.1.3 运行环境 & 调试环境
打开vscode
-> 打开文件夹(文件夹里面已经有.py文件,或者创建一个空的xxx.py文件也可以)
-> 点击左侧调试图标(虫子图标)
-> 点击"创建launch.json文件" -> 选择python
-> 点击文件夹中的某个py文件
-> vscode 下边栏 点击python版本的位置可以选择安装好的环境
- 注:
以前我习惯于在创建 launch.json 后, 在其同级位置创建 settings.json
并写入:
{
"python.pythonPath": "<env_path>"
}
-
<env_path> : anaconda 中 某个环境的位置(形如:C:\xxx\xxx\anaconda3\envs\py3_10_torch_2_0 ; 可用 conda info -v 查看),
-
但是我在新电脑(win11)最近下了新的vscode后, python.pythonPath不再是可用的配置字段了,好在可以直接点击并选择环境。
参考文章: vscode中选择Anaconda的python环境
5.2 spyder (初学者可用)
打开 annaconda -> 选择环境 -> 在主页面点击spyder图标下的 install
优点: 1.直接下载 不用配环境, 2.操作界面友好 可调试, 3.免费 无需激活
缺点: 1.不适配 git(用于代码版本控制 溯源)、 ssh(用于连接远程主机) 等工作中 程序开发常用的环境(这或许意味着在入职后需要花时间适应vscode) 2. 命令行输入参数 无法调试、运行 (如 最终需要在命令行执行 python xxx.py param1 这个例子在spyder中直接运行xxx.py 是无法输入 param1的),当然这不是致命问题
7. 安装结果测试
7.1 环境查看
如前文所述,查看 gpu版本(nvidia-smi)、cuda & cudnn 版本(nvcc -V)、python环境 (conda info -e)、python 库(先 conda activate <env_name> ,然后 conda list)
7.2 vscode 简单调试
- 简单测试一下 torch
这里安装的是 torch 2.0 ,听说它有加速效果,但是对于windows,torch. compile (model) 这个语句会报错,我网上搜索的原因是 没有适配 windows。
参考: (github) PyTorch 2.0 not working on Windows #90768
#%% import
import torch
import torchvision.models as models
#%% test
def test():
model = models.resnet18().cuda()
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)
compiled_model = torch. compile (model) # 关键一行 torch 2.0 加速似乎还没适配 windows
x = torch.randn(16, 3, 224, 224).cuda()
optimizer.zero_grad()
out = compiled_model(x)
out.sum().backward()
optimizer.step()
def test2():
print("info | test2() | start ...")
model = models.resnet18().cuda()
print("info | test2() | model:", model)
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)
print("info | test2() | optimizer:", optimizer)
x = torch.randn(16, 3, 224, 224).cuda()
print("info | test2() | input shape:", x.shape)
optimizer.zero_grad()
out = model(x)
out.sum().backward()
optimizer.step()
print("info | test2() | end ...")
#%% main
if __name__ == "__main__":
print("start testing...")
# test()
test2()