试用point-e遇到的问题总结

文章描述了在Ubuntu18系统上,使用RTX3090显卡和CUDA11.6遇到的torch运行错误,问题源于cuda版本与库不匹配。作者尝试升级显卡驱动至525版,解决了旧驱动与新驱动的冲突,并详细记录了卸载旧驱动、安装新驱动以及CUDA的配置过程,最终成功运行环境。
摘要由CSDN通过智能技术生成

最终运行环境

ubuntu18 cuda11.6 RTX3090*2 显存24G*2 RAM128G

clone官方仓库运行过程中的问题

先是直接运行就报错,他这个代码实现使用的torch,报错内容是类似OSError: libcusparse.so.11 libcusparse.so.11缺少什么的,这种错误属于cuda版本不匹配导致的,

直接使用import torch测试,就会报这错误

解决方法是,先寻找对应当前cuda版本的torch torchvision,去pytorch官网下

(nvcc -V查看cuda版本)

我是没找到对应版本

我的显卡驱动是470 cuda是11.1

于是打算更换显卡驱动

直接去nvidia下载对应525显卡run驱动,提示无法安装,告诉你你的显卡驱动在使用中。

所以换成ubuntu18自带软件,软件与更新还是什么,里面的附加驱动

换成525专有驱动,

打开系统监视器看网速只有100k/s

更换到apt清华源20m/s

完成后使用nvidia-smi报错NVLM mismatch什么的问题,百度后得知是内核显卡驱动版本和新安装的冲突。

可以命令查看内核显卡版本,

解决方法是卸载所有nvidia旧驱动,得多运行看卸干净没,再重启

再安装新驱动,安装好nvidia-smi还是报错,再重启就好了

之后是cuda,我的旧cuda11.1不用删,在bashrc里注释就行,

cuda官网下好run后

安装时,有个[x]driver,你回车就能取消这个,否则安装或报错,说你已经有驱动了。

之后再install,cuda完成后还需要配置

export PATH="$PATH:/data/zhangjiong/cuda-11.6/bin"

export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/data/zhangjiong/cuda-11.6/lib64/"

export LIBRARY_PATH="$LIBRARY_PATH:/data/zhangjiong/cuda-11.6/lib64"

11.6改成你的版本,放到bashrc里。

之后运行出结果如下

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值