ubuntu20.04 anaconda3虚拟环境安装 paddlepaddle-gpu 2.2.0

官网教程:
快速安装的命令语句:
https://www.paddlepaddle.org.cn/

官网的详细安装教程:
https://www.paddlepaddle.org.cn/documentation/docs/zh/install/conda/linux-conda.html
两个网址都可以,都是官网的方法,实测可行。

安装的前提环境是:
先装好系统的NVIDIA显卡驱动先【本人的Ubuntu系统自带了显卡驱动,所以这步我可以省略了。】,然后就是安装好Anaconda,最后再依照官网的方法执行paddlepaddle环境的安装搭建。

检测是否安装成功的方法:
安装完成后您可以使用 python 或 python3 进入python解释器,输入import paddle ,再输入 paddle.utils.run_check()

出现 PaddlePaddle is installed successfully ONLY for single GPU! Let’s start deep learning with PaddlePaddle now. 这一句表示安装成功一半了,能勉强用,但只能使用单个GPU或者CPU。
在这里插入图片描述
接下来就是解决多GPU使用的问题了。
解决办法我是参考这个博主的办法去解决的:https://xiulian.blog.csdn.net/article/details/112507826
安装nccl:

===============   2024.05.28  补充信息 =============
在后续的开发中,发现conda其实也可以安装nccl的,一条conda命令即可完成安装,
不需要那么麻烦去看版本,然后下载对应安装包进行安装,还配置环境那么麻烦。
安装nccl的 conda 命令:conda install -c anaconda nccl  (亲测有效)
pip的安装命令:pip install nccl   (未尝试)
⭐注意:在安装nccl之前,必须成功安装完毕cuda 与 显卡驱动。

nccl下载的地址:https://developer.nvidia.com/nccl/nccl-legacy-downloadshttps://developer.nvidia.com/nccl/nccl-legacy-downloads
具体步骤是:先按照自己的cuda版本找到相应的nccl去下载(我是cuda是11.2的,所以就找回11.2对应的。选择自己的系统版本,然后根据自己想要的操作方式跟着官网的步骤去操作就好了。)在这里插入图片描述

我的操作方式是:
1.在pc端下载nccl的deb软件包。
操作是:选择 “Local installers (x86)”项 的 “Local installer for Ubuntu 20.04”,
下载了一个.deb后缀的文件【nccl-local-repo-ubuntu2004-2.8.4-cuda11.2_1.0-1_amd64.deb】
然后传去服务器上操作。

2.安装镜像库
sudo dpkg -i nccl-local-repo-ubuntu2004-2.8.4-cuda11.2_1.0-1_amd64.deb

3.更新源镜像
sudo apt update

4.安装nccl
sudo apt install libnccl2=2.8.4-1+cuda11.2 libnccl-dev=2.8.4-1+cuda11.2

剩下就是配环境了。
将nccl添加到环境变量中
nccl默认的安装目录是/usr/lib/x86_64-linux-gnu
修改~/.bashrc文件,命令:sudo vim ~/.bashrc
在最末尾添加如下内容到文件中:
在这里插入图片描述

注意:我还装了cuda,我cuda的安装方式是安装另外的一个博主的cuda文章去安装的,但我觉得应该是不用装cuda的,直接装nccl就好了,
如果是直接安装nccl的话,配环境的时候写
“export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/lib/x86_64-linux-gnu”	

cuda文章链接:https://blog.csdn.net/weixin_43742643/article/details/115355545

环境配置写好后,输入命令source ~/.bashrc
都搞好之后就测试一下:
在这里插入图片描述
如果出现PaddlePaddle is installed successfully!,恭喜你,说明您是 真的 真正 完全成功安装了。

最后,我声明一下,我安装了anaconda,然后用conda去安装paddlepaddle,此时能用的,但我需要多卡训练,但多卡不了,此时心态被paddlepaddle的环境搞到有点崩了,太麻烦了,所以接着我就迷迷糊糊的去安装了cuda,装完之后还是不行,接着我就安装nccl。装完了nccl之后才完全正常能训练了。

我是在训练的时候报的错误:
RuntimeError: (PreconditionNotMet) The third-party dynamic library (libnccl.so) that Paddle depends on is not configured correctly. (error code is libnccl.so: cannot open shared object file: No such file or directory)
在这里插入图片描述

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值