RLHF实践问题记录

在跑Deepspeed的时候出现了很多问题,花了很长时间解决,期间还重新下载了Anaconda,把我已有的几个虚拟环境全删了(虽然现在看起来根本没必要这么做)。趁着代码还在跑,来此记录一下,希望能方便后来者。

错误1:nvcc不可用,可输入以下指令测试

nvcc -V

分析&解决:用pytorch安装的CUDA没有提供nvcc,需要重新安装:

conda install -c nvidia cuda-compiler

错误2:

<command-line>: fatal error: cuda_runtime.h: No such file or directory

分析&解决:还是CUDA的问题,参考这篇文章
安装完成之后需要配置cuda环境路径,打开.bashrc文件

添加如下语句:

export CUDA_HOME=/usr/local/cuda-xxx
export PATH=$CUDA_HOME/bin:$PATH
export LD_LIBRARY_PATH=$CUDA_HOME/lib64:$LD_LIBRARY_PATH

编辑完成后用如下命令激活:

source ~/.bashrc

错误3:

RuntimeError: Error building extension 'fused_adam'

解决:卸载已经安装的DeepSpeed,从github重新安装

git clone https://github.com/microsoft/DeepSpeed.git
cd DeepSpeed
DS_BUILD_FUSED_ADAM=1 pip3 install .
  • 10
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值