(租用服务器GPU大概率是这样)RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED

1.问题背景介绍

在服务器上租用实例(创建的时候自带的框架以及pytorch),跑模型的时候出现的这样的错误。
当时租用的是3090-24G,pytorch1.8.1,cuda 11.1,python3.8,ubuntu 18.04。自己刚入门,对版本这些没什么要求,租用实例的时候心想肯定时越高越好(之前听说最新的版本会出现一些问题,相当于测试版本),就租用了稍微新一点的版本。第一次跑模型使用上面自带的环境,结果没有原论文里面的好,还差了一大截。经过github的issue,解决方案是pytorch的版本会影响模型指标。为了复现论文的模型指标,我查阅了很多网上解决方案,但是都对我无效。经过多次的尝试(conda create ,conda remove……)不少于7-8次。

2.解决方案
问题根源一

查看python,pytorch,cuda是否对应。主要的问题出自于这里。
在这里插入图片描述

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值