【一次性解决】深入理解CUDA和PyTorch的安装与多版本管理的三种方式

prinTao

已于 2024-03-06 10:52:46 修改

阅读量2.2k

点赞数 45

分类专栏： CUDA编程 pytorch python 文章标签： pytorch 人工智能 python cuda

于 2024-01-25 20:09:07 首次发布

本文链接：https://blog.csdn.net/prinTao/article/details/135852908

版权

很多人配置环境就是直接安装三件套，而对于版本管理不是很清楚。在开发初期，这样做没什么问题。但是如果服务器多人使用，或者复现代码多（pytorch版本和cuda版本是互相依赖的），就需要更进一步的版本管理方法。这里将详细介绍用于深度学习或者CPP开发的CUDA版本管理方式。

在配置环境前，首先需要明确自己的需求。一般来说，CUDA将会被用于：

对于使用Python进行的开发，推荐在linux上使用Docker，Windows上使用anaconda。对于C++开发，只使用方法一手动管理版本即可，无须安装anaconda和docker。请注意，以下的方法选择其一即可，混着用容易把自己搞乱了。

下面是目录，按需要跳转：

CUDA是基于驱动运行的，所以安装显卡驱动必不可少。这一步非常简单，在linux和windows上都比较好做。这里暂时跳过。

我们使用什么版本cuda的，取决于要使用的PyTorch版本。在配置环境前，首先需要明确自己的需求。

pip的版本管理很混乱，在每次使用的过程中都要小心，哪些包的版本被修改了。因此建议对于版本跨度大的包，使用conda等虚拟环境隔离。

注意，这里的CUDA版本是假的，默认显示一个数值。还是需要继续安装~

nvidia-smi

输出方框就说明显卡驱动正常，可以继续。

方法一：使用`系统环境变量`管理多版本CUDA

方法相对来说最简单，直观。就是更改cuda对应的系统环境变量，使得其指向不同的版。

优点：

缺点：

很多仓库在安装时候会指定cuda-tookit，导致环境