在深入研究深度学习和CUDA编程时,一个常见的挑战是确保你的计算机上安装的CUDA版本与你的应用程序或框架兼容。不匹配的CUDA版本可能导致程序无法正常运行。本篇博客将指导你如何卸载当前不匹配的CUDA版本,并安装正确的版本来避免兼容性问题。
步骤1:卸载当前CUDA版本
在开始之前,重要的是先清理你的系统,移除所有不需要的NVIDIA程序。通过以下步骤卸载当前的CUDA版本:
- 打开控制面板。
- 确保保留以下三个NVIDIA程序:NVIDIA的图形驱动程序、NVIDIA PhysX系统软件、NVIDIA GeForce Experience。
- 将视图按照【安装时间】排序,依次卸载所有其他NVIDIA相关软件。
步骤2:查看CUDA版本
在卸载完成后,验证你的CUDA版本是否已完全移除:
shellCopy code
nvidia-smi
步骤3:安装正确的CUDA版本
在卸载了不匹配的CUDA版本后,是时候安装一个与你的硬件和软件需求相匹配的正确版本了。
- 下载CUDA:前往NVIDIA官网下载与你的计算需求相匹配的CUDA版本。(cuda12.1 网址:CUDA Toolkit 12.1 Downloads | NVIDIA Developer
- 安装过程中注意事项:在安装过程中,建议取消勾选Visual Studio Integration选项,因为如果没有安装Visual Studio,该模块无法正常工作。这个选项主要是为了在需要编译CUDA程序时提供支持,但在Windows环境下不建议进行此类编译。选择所有其他默认安装选项。
步骤4:验证CUDA安装
检查cuda是否安装成功,在cmd中输入nvcc -V
安装成功的结果
如果没有显示没有nvcc这个命令,那就添加环境变量。具体要先查看C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.1\bin是否有nvcc.exe,如果有,那就需要添加环境变量。
通过右键点击此电脑——>属性——>高级系统设置——>环境变量。
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.1\bin
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.1\libnvvp
image
选择系统变量中path,点击编辑,然后点击新建,添加
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.1\bin
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.1\libnvvp
两个路径
步骤5:安装cuDNN(可选)
如果你的深度学习框架需要cuDNN,按照以下步骤安装:
- 从NVIDIA官方网站下载cuDNN。
- 解压下载的文件,并将
bin
、include
和lib
目录中的内容复制到CUDA安装目录下的相应文件夹中。 - 更新系统环境变量的Path,添加CUDA和cuDNN的路径。
1.官网下载链接,下载cudnn
cuDNN Archive | NVIDIA Developer
2.解压下载得到的CUDNN压缩包,会得到一个名为cuda的目录,将其中bin,include和lib目录中的内容拷贝到CUDA的安装目录(C默认为:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.1)下的对应目录中(
在安装和配置CUDA及cuDNN环境时,用户可能会在CUDA的安装目录中遇到与cuDNN解压缩后的文件夹同名的文件夹。在这种情况下,不必担心文件的覆盖或冲突问题。用户可以直接将cuDNN解压缩后的文件夹中的配置文件复制到CUDA安装目录中的对应同名文件夹内。这一过程中,cuDNN的配置文件会被添加到CUDA的相应位置,从而实现两者的整合。
需要强调的是,尽管文件夹名称相同,但这一操作是必要的,因为cuDNN实际上作为CUDA的一个补丁存在,旨在为深度学习的计算过程提供优化。因此,将cuDNN的内容正确复制到CUDA的安装目录中是确保深度学习应用能够充分利用GPU加速的关键步骤。
为了保证配置的准确无误,建议用户分别将cuDNN解压缩后的文件夹内容仔细地复制到CUDA安装目录下的对应文件夹中,避免直接整体复制粘贴,以确保每个文件都被正确放置。)
。
image
3.在系统环境变量的Path中新增如下两项(对应自己的安装目录)。
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.1
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.1\lib\x64
4.配置完成后,我们可以验证是否配置成功,主要使用CUDA内置的deviceQuery.exe 和 bandwithTest.exe:
首先win+R启动cmd,cd到安装目录下的 cd /d C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.1\extras\demo_suite
cd /d C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.1\extras\demo_suite
然后分别执行bandwidthTest.exe和deviceQuery.exe,应该得到下图:
bandwidthTest.exe运行成功结果
deviceQuery.exe运行成功结果
两步都返回了Result=PASS,就算成功。
下载pytorch
官网地址为:PyTorch
结论
通过以上步骤,你可以确保你的系统上安装了正确的CUDA版本,以避免在运行CUDA应用程序时遇到兼容性问题。正确配置CUDA和cuDNN是优化深度学习工作流程的关键步骤。希望这篇博客能帮助你解决CUDA版本不匹配的问题,并顺利进行深度学习项目的开发。