报错截图:
问题描述:
在使用PaddleGAN实现数字人的过程中,wav2lip模块在使用GPU时报错。
解bug:
1. 最简单的方法是将'use_gpu=True'改为'use_gpu=False',相应的运算速度会下降很多。
2. 很多说法是GPU驱动版本问题,但现在改不了驱动版本。
ps. 现cuda=12.1, cudatoolkit=11.2.2, cudnn=8.1.0.77
3. 配置临时变量:
export LD_LIBRARY_PATH=xxx/自己虚拟环境的名称/lib:$PATH
bug进入二阶段:
这个问题是找不到'libcudart.so.10.2'文件。按照如下步骤排查:
首先看安装目录下有没有libcudart.so.10.2这个文件
如果没有的话,说明安装出错,需要重新去安装对应gpu版本的包
如果有的话,说明是系统没找到,就应该手动添加PATH
采用添加临时变量的方式
export LD_LIBRARY_PATH=xxx/cuda-12.1/lib64:$LD_LIBRARY_PATH 返回'Segmentation fault' 。wtm... 搁这儿套娃呢!
最终解决方案:
降版本:cuda12.1->10.2
注:使用'nvcc --version'查询,'nvidia -smi'和'nvitop'查询的是硬件设备设定的最高版本