一、【知识扫盲】Anaconda、CUDA 和 cuDNN
- 安装 Anaconda 通常包含了 Python 的发行版以及一些常用的数据科学库和工具。然而,如果你要在 Anaconda中使用深度学习框架,如 PyTorch,TensorFlow,并且希望利用 GPU 进行加速,那么你可能需要单独安装 CUDA 和cuDNN。
- CUDA 是 NVIDIA 提供的并行计算平台和编程模型,用于利用 NVIDIA GPU
进行加速计算。深度学习框架(如 PyTorch、TensorFlow)通常使用 CUDA 来加速模型训练和推断。 - cuDNN是一个加速深度神经网络的库,为深度学习框架提供了 GPU 加速的基本构建块。
- 如果你计划使用 GPU加速来进行深度学习任务,确保你的 CUDA 和 cuDNN 版本与你选择的深度学习框架版本兼容。在大多数情况下,这需要手动安装 CUDA和 cuDNN。
二、【跑深度学习遇到的问题】
- 以前我用yolov8跑深度学习模型,我分明想用gpu跑,但是每次都报错gpu not available,只能先用cpu跑了。以前一直不知道为什么总是错,后来跟别人交流才知道这种学习框架是分gpu和cpu的,pytorch是cpu版,pytorch-gpu才是gpu版,我之前安装的是cpu版本的,想用gpu当然是不可能的了。相信大家也都听了很多遍gpu比cpu跑得快很多,但是没有接触过的同学肯定会像我一样,没有量化的知道gpu到底有多快,刚开始可能误打误撞只能用cpu跑,觉得算了就这样跑吧,自己弄gpu弄不对,很担心。今天看了一个帖子,稍微对比一下gpu能比cpu跑的快三四倍,果断想快点装好gpu版本的,好好跑一下,通了的话以后就都能用gpu跑了!否则能两个小时结束的模型非得到九个小时,真的浪费时间。
三、【记录一下我的奇怪零碎问题和解决方案】
1. 起因:说我的GPU不能用,我很奇怪,我以为是因为我的驱动程序没装好。
我以为No running processes
found代表我的nvidia驱动程序没装好,还重新装了一遍驱动程序,后来发现完全是因为没有进程用到gpu,它在闲置。。
2. 不过在重新安装INVIDIA驱动程序的过程中,我发现了新的问题并且解决了新问题,记录一下。 安装CUDA和cuDNN先检查版本兼容性,我的python是3.9,所以可以装的cuda是11.2,cuDNN是8.1
- 安装cuda,在第一步,系统检查报错:NVIDIA安装程序无法继续
AI说我的nvidia程序安装没有成功安装,但自己查过相关资料发现我的程序是成功安装过了的(AI说话不能全信,特别是装程序,平时问一些指令还行)重新查资料处理。。。
- 卸载重装
- 此时第一步【系统检查】没有问题了
为了后续方便我把它安装在默认的C盘【提前声明:本人的电脑在下载普通软件的时候都不会放在C盘,节省C盘空间。这种专业的软件,本人会放在C盘,为了后续操作。各位勿喷,本人的C盘够用】
- 报错:CUDA Visual Studio Integration 未找到Visual
Studio的支持版本,后退,将CUDA中的Nsight VSE和Visual Studio Integration取消勾选
- 目前,cuda程序顺利安装
- 安装完成,虽然环境变量已经自动配置到了,但仍然需要重启电脑。否则nvcc–version看CUDA信息还是显示没有
补充:
“nvcc --version"命令用于查看CUDA编译器(NVIDIA CUDA Compiler)的版本信息。
通过运行"nvcc --version"命令,你可以确定安装在你的系统上的CUDA编译器的版本。该命令将显示CUDA编译器的版本号以及其他相关的信息,如编译器的路径和所支持的构架。这对于开发和调试CUDA程序以及确保系统上安装了正确的CUDA版本是非常有用的。
在运行"nvcc --version"时出现”'nvcc’不是内部或外部命令,也不是可运行的程序或批处理文件"的错误消息,这通常表示CUDA没有正确安装或没有配置好环境变量。
2.安装cuDNN
这个简单,根据这位博主去做就可以完成NVIDIA 安装 cuDNN