出现问题的原因在于cuda11.8只能安装torch2.0以上版本的tpyorch环境,但是2.0以上版本的torch会拥有自己的cuda依赖库(cuda toolkit)
如果CUDA Insatller环节中选择CUDA Toolkit选项,那么在后续阶段训练模型时会出现索引链接冲突的问题,此时需要删除已经安装的CUDA Toolkit
解决方法如下:
cd /usr/local/cuda-11.8/bin
sudo ./cuda-uninstaller
只选择CUDA Toolkit选项,点击Enter确定。
Successfully uninstalled
此时证明卸载成功,接下来可以尝试继续训练模型了。