【显卡驱动与cuda】pytorch突然无法调用GPU

最新推荐文章于 2024-08-29 15:54:52 发布

W1a2b3D

最新推荐文章于 2024-08-29 15:54:52 发布

阅读量2.4k

点赞数

分类专栏： GPU相关文章标签： pytorch 人工智能 python

本文链接：https://blog.csdn.net/W1a2b3D/article/details/126400921

版权

GPU相关专栏收录该内容

3 篇文章 0 订阅

订阅专栏

问题

这台服务器我已经好久没连接了，自己在配新的conda环境的时候一直无法调用GPU
- torch.cuda.is_available()返回false
- torch.backends.cudnn.enabled返回True
- nvidia-smi能正常返回
当时一直在考虑是不是自己环境这边没配好，后来用师兄的账号登了一下，发现他的torch也调用不了GPU了，并且之前正在运行的代码报错 cuda runtime error：
判断是服务器的cuda或者显卡驱动的问题

排查

当时考虑了以下几点
- 装的torch版本支持的是10.1的cuda
- 因为服务器装了多个cuda版本（9.0和10.1）
  - 查了软连接，发现默认确实是指向10.1，并且最近没有发生修改（cd到 /usr/local 再 stat cuda）
  - 检查环境变量，也是配置的10.1

在这里插入图片描述

export PATH=/usr/local/cuda-10.1/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

解决

服务器的用户比较多也不太好逐一排查是谁有意无意的操作…
和师兄讨论了一下，感觉cuda应该没什么问题，可能是显卡驱动的问题
怀疑是不是显卡驱动自己悄悄更新了，但发现版本号并没有变化，排除。
重新安装驱动 NVIDIA-Linux-x86_64-418.87.01.run
服务器重启之后就OK了

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

W1a2b3D

关注关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

PyTorch GPU不可用问题排查及解决方法

Bsv___的博客

10-11

4358

如果已安装了正确的CUDA版本，但仍然无法使用GPU，可以尝试更新PyTorch和CUDA到最新版本。：如果已安装了正确的CUDA版本，但仍然无法使用GPU，可以尝试更新PyTorch和CUDA到最新版本。：有时候CUDA驱动或PyTorch安装可能出现问题，导致无法正确识别GPU设备。：有时候CUDA驱动或PyTorch安装可能出现问题，导致无法正确识别GPU设备。：如果以上解决方法都无效，可以向PyTorch官方论坛或其他深度学习社区寻求专业支持，寻求更详细的帮助和指导。

PyTorch：没有可用的CUDA GPU解决方案

与其临渊羡鱼,不如退而结网

05-31

1万+

如果您在程序中没有显式地指定要使用哪个GPU，那么PyTorch会尝试使用CUDA_VISIBLE_DEVICES环境变量中指定的第一块GPU。在使用PyTorch进行深度学习模型训练时，请务必确保您已经正确安装了CUDA和cuDNN，并且电脑上的显卡支持CUDA加速。如果您已经安装了正确版本的CUDA和cuDNN，那么请确认您的显卡是否支持CUDA加速。您可以在这里找到支持CUDA的显卡列表。如果输出结果为“0”或“0,1,2,3”等值，那么就意味着PyTorch会使用相应编号的GPU运行。

2 条评论您还未登录，请先登录后发表或查看评论

解決 torch 無法使用GPU

chencef的博客

02-19

8269

重新安裝 torch ，解決 torch 無法使用GPU問題

PyTorch安装成功，但不能使用GPU功能：PyTorch no longer supports this GPU. CUDA error: no kernel image is available

热门推荐

qq_40877575的博客

04-17

2万+

pytorch无法调用gpu的解决方法 UserWarning: CUDA initialization: The NVIDIA driver on your system is too old (found version 10010). Please update your GPU driver by downloading and installing a new version 导入torch后torch.cuda.is_available()为false ELF标头无效

pytorch安装及使用GPU失败的解决办法

qq_43344096的博客

11-03

7728

安装pytorch环境、无法使用GPU解决办法

PyTorch版本更新后无法调用GPU显卡的原因及解决办法

哈哈哈哈哈嗝哈哈哈

02-17

1万+

使用PyTorch在网络模型训练过程中，如果更新了PyTorch的版本，则可能会出现无法使用GPU的情况，本文将探究其原因，并给出解决方法。

NVIDIA显卡驱动，cuda，pytorch

2301_77778490的博客

09-19

430

CUDA是NVIDIA开发的一种编程接口，它允许程序员使用C/C++语言编写并行代码，从而充分利用GPU的并行计算能力。在使用CUDA进行编程时，程序员需要编写一段名为kernel的代码，该代码定义了在GPU上执行的操作。PyTorch是一个开源的机器学习框架，它使用张量作为基本数据结构，并支持GPU加速。PyTorch通过使用CUDA，可以使张量在CPU或GPU上执行计算。NVIDIA显卡驱动是计算机硬件层面的程序，它为显卡提供软件支持，使显卡能够正常运行，并使计算机能够使用GPU进行计算。

（已解决）Pytorch/Tensorflow检查能否调用GPU及CUDA、Nvidia驱动和cuDNN的卸载重装

Keyu_logs

05-28

9458

Tensorflow 未使用GPU的问题系统：Ubuntu 16.04 之前按照这篇博客成功装好了 CUDA 10.2、Nvidia驱动及 cuDNN 7.6.5 ，跑mnist测试通过了。然而，跑一个基于tensorflow 1.14.0的深度学习代码时，发现训练速度特别慢。这是不应该的，因为我在运行程序时指定了使用GPU（ Nvidia GTX 2080Ti）。事实证明如果直接跑别人代码而不仔细看每一个细节处理的话，就会踩这种「以为设置的参数一定是真的」的坑。。。仔细看了下终端的log，发现了几句

Windows下显卡支持的cuda及配套GPU版本pytorch下载全流程（2022.03.27）

Geoffrey0718的博客

03-27

8256

在Windows环境下mx150显卡安装cuda及pytorch，并且成功调用cuda执行命令全过程。

pytorch_multi_gpu:如何在Pytorch中使用Multi GPU？

04-01

在PyTorch中使用多GPU是为了加速深度学习模型的训练，特别是在处理大数据集或构建复杂的神经网络时。PyTorch提供了DataParallel和DistributedDataParallel（DDP）两种主要的方法来实现这一目标。这里我们将详细探讨...

Pytorch 无法识别GPU问题解决方法

Yc Chan 的个人博客

02-27

2443

在本文中，我们将介绍如何解决PyTorch无法识别GPU的问题，并提供一些示例来说明解决方法。在深度学习领域，GPU是加速模型训练和推理的重要工具之一。然而，有时候我们会面临PyTorch无法正确识别GPU的情况，即torch.cuda.is_available()函数返回False。接下来，我们将详细讨论这个问题及其解决方法。

GPU版本pytorch无法调用问题

weixin_70423469的博客

06-20

1751

GPU版本pytorch无法调用问题

win10 1050显卡torch调用不到GPU问题处理

RayChiu757374816的博客

12-31

3177

1050显卡清华源下使用conda安装指定版本的torch和组件，解决不能调用gpu的问题，使之可以用gpu训练。

【问题解决】| 关于torch无法使用GPU的一些实验探索，思考

专注于人工智能的算法与应用

03-03

3530

实验证明在pip指令后面的 cu118才是关键。Fridemn-CSDN博客做实验尝试做到很晚但是我们目前只能说有一些感性的认识，总结了一些经验但是对于CUDA的理解还是有很多不到位的地方，需要后面不断的实践补充。

关于PyTorch找不到CUDA / PyTorch突然用不了GPU / pytorch的版本匹配相关问题

qq_46362641的博客

04-24

4157

base环境中没有pytorch，在安装torchvision时自动安装了cpu版本的torch，并且不知为何隐藏了起来，用conda list找不到，但每次使用python时都默认使用的是该版本的torch，无论我怎么折腾gpu版本的pytorch也无济于事啊！问题来了，安装了正确版本的pytorch，显卡也支持，实在想不出还是因为什么。至于torch和cuda版本匹不匹配，在经过很多次检查，看网上的帖子，最终还是确定是匹配的，并且就如我在上面写的，用官网的下载命令一般都是匹配的。

解决pytorch无法用GPU

weixin_63695671的博客

11-09

1101

第二，用管理员身份打开conda命令行，卸载cpu版的pytorch。卸载cpu的pytorch，安装GPU的pytorch。第一，先在该环境下创建test.py，输入下面代码。我们成功安装了GPU版的pytorch。最后在原来的test.py测试。我们发现是CPU版。

torch检测不到gpu，无法使用cuda

好好学习|学无止境

07-20

812

一开始以为是cuda的版本不对，就开始不断的实验各种版本，后来发现可能是使用清华源下载时自动下载的cpu版本。查看torch版本的python命令，用pytorch官网自带的源下载。，发现输出的确为cpu版本。torch无法使用cuda。

MX250显卡驱动与CUDA 10.2和cuDNN 10.2的集成

显卡驱动程序是操作系统与显卡硬件之间的桥梁，它使得操作系统能够通过编程接口来控制显卡，从而执行图形渲染、视频播放、游戏画面渲染等任务。NVIDIA官方定期发布新的驱动程序版本，以修复已知的bug、提升性能和...