深度学习1:环境安装(windows系统+本机显卡)

提要

  1. 目录即步骤!
  2. 安装的是 torch 2.0 (小节4.3.1),听说它有加速效果,但是对于windows,torch. compile (model) 这个语句会报错,我网上搜索的原因是 没有适配 windows。

1.显卡信息查看

1.1 在电脑上直接查看

(1) 方法1: 设备管理器 -> 显示器适配器
显卡型号
(2) 方法2: 右键 -> 英伟达控制面板
显卡型号+版本号

1.2 在 cmd 中查看

(1)nvidia-smi
显卡型号+版本号+cuda版本

(2)nvcc -V
cuda 信息

安装详见 小节 3.cuda & cudnn 安装

2.anaconda 安装

官网: https://www.anaconda.com/products/individual
下载安装就完事儿了

3. cuda & cudnn 安装

关键在于 显卡驱动、cuda、cudnn、torch (或 tensorflow) 四者的版本要对上!!!

  • 提示:①先看看自己的显卡型号,②根据显卡版本确定对应的 cuda,③根据cuda确定 cudnn、torch 版本

3.1 CUDA 安装

下载地址:
https://developer.nvidia.com/cuda-toolkit-archive

  • 查看 cuda & 与显卡驱动 对应的关系:
    https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html

3.2 cudnn 安装

(1) 下载地址:
https://developer.nvidia.com/rdp/cudnn-archive
可以看到 cudnn & CUDA 的版本对应关系。

(2)拷贝子文件夹(形如:bin, include, lib 等)放到cuda安装目录下(C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8)

(3) 编辑环境变量

  • CUDA_PATH
    C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8
    一般而言,装好cuda后CUDA_PATH已经存在

  • CUDA_BIN_PATH
    C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\bin

  • CUDA_LIB_PATH
    C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\lib\x64

  • CUDA_SDK_PATH
    C:\ProgramData\NVIDIA Corporation\CUDA Samples\v11.8

  • CUDA_SDK_BIN_PATH
    C:\ProgramData\NVIDIA Corporation\CUDA Samples\v11.8\bin\win64

  • CUDA_SDK_LIB_PATH
    C:\ProgramData\NVIDIA Corporation\CUDA Samples\v11.8\common\lib\x64

3.3 安装错版本如何卸载

  • 我们打开 “应用和功能” 搜索 nvidia 进行卸载:
    对于含cuda字眼的,以及结尾有cuda版本号的可以卸载。
    如果不确定那个程序能不能删除,可以百度看看,程序什么用途的。
    NVIDIA的软件一个个都有其独立卸载程序,不用担心卸载顺序。
    留下:NVIDIA的图形驱动程序、NVIDIA Physx系统软件,NVIDIA GeForce Experience(如果你有这3个软件,就别卸载)。
    卸载:
    1.推荐排序。 点击顶部时间小三角排序,可发现一个叫NVIDIA Nsight HUD Launcher 的带眼睛图标的排列在较前面。然后从下往上卸载,跳过 NVIDIA图形驱动、NVIDIA Physx系统软件、NVIDIA GeForce Experience。
    2.软件名含cuda的,或者版本号的(如 11.8),或者SDK,以及 NVIDIA Nsight HUD等,这些都可以卸载掉。
    3.卸载完后,你会发现电脑—开始—所有程序,里面那个关于NVIDIA的程序文件不见了。存在的话,也可以看看里面还剩下什么,可以搜索看看。当然,C盘里面C:\Program Files\NVIDIA GPU Computing Toolkit文件也可以删除了。
    4.清理下电脑,主要是清理注册表

4. python 安装

打开 anaconda powershell promt 终端 在里面输入相关命令。具体如下:

4.1 conda 创建新python环境

conda create --name <env_name> python=<py_version>

  • 需要自己填写的参数
    <env_name>: 环境名称 形如 py3_6_ tf_gpu、py3_10_torch_2_0 等
    <py_version>: python 版本号

  • 验证:
    conda info -e 命令可以查看 环境名称 与 安装位置

  • 进入环境(也可切换环境):
    conda activate <env_name>

  • 退出环境(回到 base):
    conda deactivate

4.2 更多 conda 命令

  • 删除环境
    conda remove -n <env_name> --all
  • 查看库
    conda list
  • 克隆环境
    conda create -n <new_env_name> --clone <orig_env_name>

4.3 拓展阅读

4.3.1 python 各版本差异

https://blog.csdn.net/qq_35952638/article/details/103101820

5.python 库安装

conda activate <env_name> 进入环境后

5.1查看已安装的库

conda list

5.2下载库

pip install <module_name> -i <url_http>

  • 注:
    <module_name> : 库名 形如 numpu
    <url_http> : 镜像站网址 (也可不要 -i <url_http> 如果科学上网的话)

  • 镜像站地址
    http://pypi.douban.com/simple/ 豆瓣
    http://mirrors.aliyun.com/pypi/simple/ 阿里
    http://pypi.hustunique.com/simple/ 华中理工大学
    http://pypi.sdutlinux.org/simple/ 山东理工大学
    http://pypi.mirrors.ustc.edu.cn/simple/ 中国科学技术大学

  • tips
    网站一般用 http 而非 https 后者有加密, 下载库可能报错

  • 延申阅读
    (1)Conda创建新环境
    (2)解决:CondaHTTPError: HTTP 000 CONNECTION FAILED for url <https://repo.anaconda.com/pk gs/main/win-64/c
    简述: 这个报错 需要改 .condarc文件 的内容: 替换 https -> http
    该文件的路径形如 C:\Users\xxxx\.condarc

5.3 常用的库

5.3.1 torch (注意 torch & cuda 版本)

  • 查看 torch & cuda 版本关系
    (1) https://pytorch.org/get-started/previous-versions/
    (2) https://gitcode.net/mirrors/pytorch/vision?utm_source=csdn_github_accelerator

  • 安装 torch 2.0 - 注意 显卡(>=452.39)&cuda(11.8.x)&cudnn(v8.9.0) 是否支持 !!!

pip install torch==2.0.0+cu118 torchvision==0.15.1+cu118 -f https://download.pytorch.org/whl/torch_stable.html --trusted-host=pypi.python.org --trusted-host=pypi.org --trusted-host=files.pythonhosted.org

5.3.2 tensorflow

6. 编译器安装

6.1 vscode (推荐)

6.1.1 app下载

官网下载安装即可

6.1.2 扩展工具下载

打开vscode -> 点击左侧扩展图标(几个方块) -> 搜索python -> 下载扩展

6.1.3 运行环境 & 调试环境

打开vscode
-> 打开文件夹(文件夹里面已经有.py文件,或者创建一个空的xxx.py文件也可以)
-> 点击左侧调试图标(虫子图标)
-> 点击"创建launch.json文件" -> 选择python
-> 点击文件夹中的某个py文件
-> vscode 下边栏 点击python版本的位置可以选择安装好的环境

  • 注:
    以前我习惯于在创建 launch.json 后, 在其同级位置创建 settings.json
    并写入:
{
	"python.pythonPath": "<env_path>"
}
  • <env_path> : anaconda 中 某个环境的位置(形如:C:\xxx\xxx\anaconda3\envs\py3_10_torch_2_0 ; 可用 conda info -v 查看),

  • 但是我在新电脑(win11)最近下了新的vscode后, python.pythonPath不再是可用的配置字段了,好在可以直接点击并选择环境。
    参考文章: vscode中选择Anaconda的python环境

5.2 spyder (初学者可用)

打开 annaconda -> 选择环境 -> 在主页面点击spyder图标下的 install
优点: 1.直接下载 不用配环境, 2.操作界面友好 可调试, 3.免费 无需激活
缺点: 1.不适配 git(用于代码版本控制 溯源)、 ssh(用于连接远程主机) 等工作中 程序开发常用的环境(这或许意味着在入职后需要花时间适应vscode) 2. 命令行输入参数 无法调试、运行 (如 最终需要在命令行执行 python xxx.py param1 这个例子在spyder中直接运行xxx.py 是无法输入 param1的),当然这不是致命问题

7. 安装结果测试

7.1 环境查看

如前文所述,查看 gpu版本(nvidia-smi)、cuda & cudnn 版本(nvcc -V)、python环境 (conda info -e)、python 库(先 conda activate <env_name> ,然后 conda list)

7.2 vscode 简单调试

  • 简单测试一下 torch
    这里安装的是 torch 2.0 ,听说它有加速效果,但是对于windows,torch. compile (model) 这个语句会报错,我网上搜索的原因是 没有适配 windows。
    参考: (github) PyTorch 2.0 not working on Windows #90768
#%% import
import torch
import torchvision.models as models

#%% test
def test():
    model = models.resnet18().cuda()
    optimizer = torch.optim.SGD(model.parameters(), lr=0.01)
    compiled_model = torch. compile (model)   # 关键一行 torch 2.0 加速似乎还没适配 windows
    x = torch.randn(16, 3, 224, 224).cuda()
    optimizer.zero_grad()
    out = compiled_model(x)
    out.sum().backward()
    optimizer.step()

def test2():
    print("info | test2() | start ...")
    
    model = models.resnet18().cuda()
    print("info | test2() | model:", model)
    
    optimizer = torch.optim.SGD(model.parameters(), lr=0.01)
    print("info | test2() | optimizer:", optimizer)
    
    x = torch.randn(16, 3, 224, 224).cuda()
    print("info | test2() | input shape:", x.shape)
    
    optimizer.zero_grad()
    out = model(x)
    out.sum().backward()
    optimizer.step()
    
    print("info | test2() | end ...")

#%% main
if __name__ == "__main__":
    print("start testing...")
    # test()
    test2()

代码参考:PyTorch 2.0 重磅发布:一行代码提速 30%

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值