一、环境配置
Ubuntu 22.04.4
cuda 11.8
torch==2.1.1
torchvision==0.16.1
causal-conv1d==1.1.1
mamba-ssm==1.1.1
二、配置Mamba环境
创建环境
conda create -n mamba python=3.10.13
conda activate mamba
安装cudatoolkit
conda install cudatoolkit==11.8 -c nvidia
安装pytorch和torchvision
pip install torch==2.1.1 torchvision==0.16.1 torchaudio==2.1.1 --index-url https://download.pytorch.org/whl/cu118
conda install -c "nvidia/label/cuda-11.8.0" cuda-nvcc
conda install packaging
配置到这一步可能都没出现什么报错,但是接下来安装conv1d和mamba-ssm的时候可能会出现报错。
安装conv1d和mamba-ssm
pip install causal-conv1d==1.1.1
pip install mamba-ssm==1.1.1
注:这里conv1d需要先于mamba-ssm安装,且conv1d 和mamba-ssm的版本需要相匹配(一致)
踩坑指南:
踩坑一:cuda版本不匹配
cuda要求11.6+以上
在配置之前先用指令看一下机器支持的最高cuda配置
nvidia-smi
看看最高支持的配置是多少
CUDA Version反映的就是当前机器支持的CUDA最高版本,如图最高版本为12.3
看完版本后,查看当前机器有没有CUDA
nvcc-V
若报错,则机器没有CUDA或者路径错误。(通常都有,可能是路径配置错误)
若显示出以下内容则说明有CUDA,如下图CUDA版本为:12.3.52
踩坑二:CUDA路径错误
在安装mamba-ssm时,出现了安装库报错:No CUDA runtime is found, using CUDA_HOME=XXXXXX的情况。
此时应该是路径配置没有添加。
打开终端后,在终端输入
vim ~/.bashrc
打开文本后,在文本末尾增加
export PATH=cuda_path/cuda-nvcc-11.8.89-0/bin:$PATH
export LD_LIBRARY_PATH=cuda_path/cuda-nvcc-11.8.89-0/lib:$LD_LIBRARY_PATH
export CUDA_HOME=$CUDA_HOME:cuda_path/cuda-nvcc-11.8.89-0
保存并退出
:wq
更新环境变量
source ~/.bashrc
此时的路径配置应该就没问题了
但是我在配置过程中,刚开始配置错位置了,因此要重新配置。在重新安装mamba-ssm的时候又出现了同样的报错,但是直接在终端vim ~/.bashrc后,啥也不做直接关闭重新安装mamba-ssm,又安装成功了。有知道原因的大佬可以补充一下。
参考:
配置参考:配置环境
路径参考:路径更改