Linux下运行Abaqus 2022 并且调用CUDA加速失败,出现 Error initializing the CUDA Driver NO_DEVICE

问题描述

当在Linux下运行abaqus job=jobname cpus=4 gpus=1 int 时,调用CUDA加速时出现以下错误:

USING ACCELERATOR PLATFORM_CUDA
Error initializing the CUDA Driver NO_DEVICE
WARNING: GPUAcceleration disabled

我的系统环境为:

Ubuntu 22.04.1 LTS
NVIDIA Corporation GA100GL [A30 PCIe]
NVIDIA-SMI 525.78.01    Driver Version: 525.78.01    CUDA Version: 12.0 
$nvcc -V
Cuda compilation tools, release 12.0, V12.0.76
Build cuda_12.0.r12.0/compiler.31968024_0

环境变量设置:

$export |grep ABA
declare -x ABA_ACCELERATOR_TYPE="PLATFORM_CUDA"

deviceQuery 测试

deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 12.0, CUDA Runtime Version = 12.0, NumDevs = 1, Device0 = NVIDIA A30
Result = PASS

简单阐述原因:

Abaqus2022 有硬缺陷,自带了libcuda之类的 低等级包,导致系统的cuda无法加载

解决方案:

把Abaqus 自带的 libcuda 包 给规避或者删除掉,问题就能解决。
具体解决方案(如果是默认安装地址):
移动以下文件:libcuda.solibcuda.so.1libcuda.so.418.39到新创建的 keepcuda 子目录,以便这些文件不会干扰系统上安装的驱动程序

  1. 进入abaqus 自带的lib库
$cd /usr/SIMULIA/EstProducts/2022/EstPrd/linux_a64/code/bin
  1. 创建规避文件夹:
$sudo mkdir keepcuda
  1. 规避自带的cuda库
$mv libcuda.so ./keepcuda/libcuda.so
$mv libcuda.so.1 ./keepcuda/libcuda.so.1
$mv libcuda.so.418.39 ./keepcuda/libcuda.so.418.39

再运行 gpus=1 应该就不会出现 Error initializing the CUDA Driver NO_DEVICE 的问题。

*注:以上解决方案默认CUDA安装正确,且通过deviceQuery 测试,CUDA的权限没有问题。否则先确认系统环境是否设定ok

https://www.chenyu-k.com/2023/02/03/2023-02-03-Abaqus-cuda-nodevice/

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Cykaede

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值