Ubuntu20.04下GraspNet复现流程中的问题

pytorch+cuda+cudnn的版本问题相对于GraspNet来说至关重要!!!至关重要!!!至关重要!!!(重要的事情说三边)

我的显卡是3070

那么首先说结论
使用30系显卡,低于11.1版本的cuda编译时会出错

nvcc fatal : Unsupported gpu architecture 'compute_86'


之前安装的是 CUDA 11.0,而 compute_86(也就是 RTX 30 系列支持)从 CUDA 11.1 才开始支持,这正是我开始编译失败的原因。

而与之对应的GraspNet官方推荐的pytorch1.6.0,已经在新版本中使用安装命令都会有问题了,下载不下来。

那么现在知道pytorch+cuda+cudnn的版本太低不行,版本高呢?

pytorch版本高于1.9之后编译knn会报错fatal error: THC/THC.h: 没有那个文件或目录
此时我的版本为:

>>> import torch 

>>> print(torch.__version__) 

2.0.0+cu117 

>>> print(torch.cuda.is_available()) 

True 

>>> print(torch.version.cuda) 

11.7


THC/THC.h头文件基本已完全移除,任何试图包含 THC/THC.h 的项目都会编译失败。
甚至于从1.8 之后开始,THC 就已经开始被逐步剥离和隐藏。

这个THC/THC.h 是属于 PyTorch 的 旧版 C/C++ 扩展接口(legacy ATen/TH/THC)


经过一整天对pytorch及cuda/cudnn当前各个版本的尝试之后发现:

安装版本如下可以完美避开版本老旧以及版本过新所造成的各种问题

如nvcc fatal: Unknown option ‘-generate-dependencies-with-compile’问题

point编译和knn编译时出现nvcc fatal  : Unsupported gpu architecture 'compute_86' 问题

THC/THC.h头文件问题等。

>>> import torch
>>> print(torch.__version__)
1.8.0+cu111
>>> print(torch.cuda.is_available())
True
>>> torch.backends.cudnn.version()
8005
>>> print(torch.version.cuda)
11.1
>>> 

实际上对于上述每个问题的解决是有具体办法的,但是有的问题解决起来简单有的却不一定简单,如果可以保留源代码不作修改就能直接使用不失为一种更快捷的办法。
那么下面是安装每个版本的方法:

首先安装cuda和cudnn

cuda版本跟着驱动来我的驱动版本是535

即:

因为是安装特定版本的pytorch、cuda和cudnn我就不说按照官网给的版本匹配来选择了直接就是特定版本的cuda安装

cuda的版本为11.1

https://developer.nvidia.com/cuda-toolkit-archive

中找到

按照如下步骤选择安装,找到安装命令

具体安装命令如下:

wget https://developer.download.nvidia.com/compute/cuda/11.1.1/local_installers/cuda_11.1.1_455.32.00_linux.runsudo 

sh cuda_11.1.1_455.32.00_linux.run

在安装过程中需要取消驱动的安装,这里我安装过了所以用的是别人的图,所以版本可能对不上。到下面的界面后在第一个出按enter取消勾选安装驱动,然后install回车即可开始安装。

随后配置bashrc
在最后面添加

export PATH=$PATH:/usr/local/cuda/bin  
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64  
export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda/lib64

之后测试安装是否成功

source ~/.bashrc
nvcc -V

结果如下

安装cudnn

cuDNN Archive | NVIDIA Developer

下载后解压

tar -vxf ./cudnn-linux-x86_64-8.9.7.29_cuda11-archive.tar.xz

复制文件

sudo cp cudnn-linux-x86_64-8.9.7.29_cuda11-archive/include/* /usr/local/cuda-11.1/include
sudo cp cudnn-linux-x86_64-8.9.7.29_cuda11-archive/lib/libcudnn* /usr/local/cuda-11.1/lib64

添加权限

sudo chmod a+r /usr/local/cuda-11.1/include/cudnn.h
sudo chmod a+r /usr/local/cuda-11.1/lib64/libcudnn*

测试安装

cat /usr/local/cuda-11.1/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

结果应该如下

安装pytorch

先安装anaconda,在

Download Now | Anaconda这里下载

下载之后

bash Anaconda3-2023.07-2-Linux-x86_64.sh

根据操作提示一直回车到yes即可

安装完成后激活一个conda环境,我这里给环境名字起得是torch,可以换成其他名字。

conda create -n torch python=3.8

激活对应环境

conda activate torch

退出conda环境

conda deactivate

移除conda环境

conda env remove -n torch

取消默认激活conda环境

conda config --set auto_activate_base false

安装pytorch 1.8.0(虽然是在conda环境中使用的安装命令,但是并不是安装到的conda环境中)

Previous PyTorch Versions | PyTorch

pip install torch==1.8.0+cu111 torchvision==0.9.0+cu111 torchaudio==0.8.0 -f https://download.pytorch.org/whl/torch_stable.html

安装完成后使用命令查看是否安装成功

python
import torch
print(torch.__version__)
print(torch.cuda.is_available())
torch.version.cuda

之后在根据GraspNet官网的步骤一直走下来就可以

GitCode - 全球开发者的开源社区,开源代码托管平台

最后运行sh command_demo.sh即可查看

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

徐凤年_

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值