ubuntu18.04+cuda11.4+nccl安装

  本文参考自,但更加详细的介绍了安装方法,避免走弯路ubuntu下安装nccl具体教程_ubuntu安装nccl-CSDN博客文章浏览阅读1w次,点赞5次,收藏12次。使用paddlepaddle框架进行多卡训练时报错:Traceback (most recent call last): File "train.py", line 210, in do_train() File "train.py", line 91, in do_train paddle.distributed.init_parallel_env() File "/home/th/anaconda3/envs/paddle/lib/pytho..._ubuntu安装ncclhttps://blog.csdn.net/Thanours/article/details/124078380?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522171265146216800182740317%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=171265146216800182740317&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduend~default-1-124078380-null-null.142%5Ev100%5Epc_search_result_base5&utm_term=ubuntu%20NCCL%20%E5%AE%89%E8%A3%85&spm=1018.2226.3001.4187本人的基本情况如下

我想要安装百度的paddle,然后出现如下报错,如下图

提示我缺少nccl,因此要安装nccl

我是ubuntu18.04,cuda11.4,下面是安装步骤

——————————————————————————————————————————

一、ubuntu安装nccl步骤

点击右侧的连接Installation Guide :: NVIDIA Deep Learning NCCL Documentation

 进入后,点击下图红色圈

进入后,点击下图红色圈

进入后,点击下图红色圈,下载历史版本

进入后,勾选I Agree To the Terms of the ,下面会出现一列列的nccl的版本

选择你自己的cuda版本的nccl,我的是11.4,要往下滑动很久,然后点击这个版本。

然后按着我下面图片画得红圈里面的命令行一步一步输入在终端里面

也就是我下面的这几段命令,我把它摘出来,方便复制

$ wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pin
$ sudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600
$ sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
$ sudo add-apt-repository "deb https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/ /"
$ sudo apt-get update

当输入倒数第二个命令的时候,会出现如下报错(我出现了,不一定每个人都出现)

解决方法为:在终端输入下面的命令

sudo gedit /usr/bin/add-apt-repository

 弹出一个文件,然后把第一行改为#!/usr/bin/python3.6,就解决了

然后再次在终端输入倒数第二个命令,还会出现一个报错,如下图

这个报错是因为缺少相应的公钥,解决办法为:在终端输入下面的命令

sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys A4B469963BF863CC

即可获取缺失的公钥,然后再次输入倒数第二条命令,就好了,然后输入最后一个命令sudo apt-get update,就完事了

然后在终端中输入下图中紫色圈内的命令

也就是我下面的这段命令,我把它摘出来,方便复制

sudo apt install libnccl2=2.11.4-1+cuda11.4 libnccl-dev=2.11.4-1+cuda11.4

到这里就安装完了

二、将nccl添加到环境变量中 

首先查找你nccl的安装目录

在终端输入命令whereis nccl

我的是在/usr/include/nccl.h

然后在终端输入vim ~/.bashrc进入该文件

添加如下内容到文件中(添加到最低行

#设置cuda库的目录
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64
#将nccl添加到LD_LIBRARY_PATH中
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/include/nccl.h

保存好后,终端输入命令:source ~/.bashrc 让配置文件生效

再通过echo $LD_LIBRARY_PATH命令查看环境变量设置是否成功。

到此大功告成,安装完毕

  • 10
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 要在 Ubuntu 18.04 上安装 CUDA 11.4,需要按照以下步骤操作: 1. 下载 CUDA 安装包:https://developer.nvidia.com/cuda-downloads 2. 在终端中输入:sudo dpkg -i cuda-repo-ubuntu1804-11-4-local_11.4.0-455_amd64.deb 3. 更新软件包列表:sudo apt-get update 4. 安装 CUDA:sudo apt-get install cuda 5. 配置环境变量:在~/.bashrc 文件中添加下面两行 export PATH=/usr/local/cuda-11.4/bin${PATH:+:${PATH}} export LD_LIBRARY_PATH=/usr/local/cuda-11.4/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}} 6. 使配置生效:source ~/.bashrc 7. 验证安装:nvidia-smi 注意:您需要先安装 NVIDIA 驱动,并确保您的 GPU 支持 CUDA。 ### 回答2: 在安装前,需要先检查计算机是否满足CUDA 11.4的系统要求。首先,需要检查计算机是否支持CUDA兼容的显卡,可以在NVIDIA官网查看。另外,需要安装NVIDIA驱动程序,以及Ubuntu 18.04操作系统。 1. 安装NVIDIA驱动程序 首先,需要在终端中添加NVIDIA源并更新,具体指令如下: sudo add-apt-repository ppa:graphics-drivers sudo apt-get update 接着,使用驱动管理器进行下载和安装NVIDIA驱动程序,具体指令如下: sudo ubuntu-drivers autoinstall sudo reboot 2. 下载CUDA Toolkit 前往NVIDIA官网下载CUDA Toolkit 11.4版本,并选择Ubuntu 18.04操作系统的版本。 接着,将下载的CUDA Toolkit 11.4安装包解压到文件夹中,打开终端进入文件夹,运行以下指令进行安装: sudo sh cuda_11.4.0_***.run --override 运行安装程序后,会显示安装过程和选项。根据需要进行配置和安装。注意,在安装过程中可能会提示安装NVIDIA现场解压程序和CUDA驱动程序,可以直接确认安装。 3. 配置环境变量 在安装完成后,需要配置环境变量,以便让系统识别CUDA。具体步骤如下: 首先,打开终端,运行以下指令创建和编辑环境变量文件: sudo gedit /etc/environment 在文件中添加以下内容: :/usr/local/cuda-11.4/bin :/usr/local/cuda-11.4/NsightCompute-2021.2:/usr/local/cuda-11.4/NsightSystem-2021.2 保存文件后,运行以下指令使其立即生效: source /etc/environment 4. 测试CUDA安装是否成功 最后,可以测试CUDA安装是否成功。在终端中运行以下指令,如果能够输出相关信息,则表明CUDA成功安装: /usr/local/cuda-11.4/samples/1_Utilities/deviceQuery/deviceQuery 以上就是在Ubuntu 18.04操作系统下安装CUDA Toolkit 11.4的详细步骤。如果出现异常问题,可以参考官方文档或在网上进行查询解决。 ### 回答3: 安装CUDA工具包是进行深度学习等高性能计算的必要步骤。在Ubuntu 18.04中,安装CUDA 11.4可以按照以下步骤操作: 第一步:下载CUDA 11.4 1.1 打开NVIDIA官网,选择CUDA Toolkit,点击Download 1.2 根据需求选择对应的版本,我以x86_64和Ubuntu 18.04为例下载 1.3 进入下载后的目录中,执行以下命令解压 $ sudo sh cuda_11.4.xxxxxx_linux.run (xxxxxx为具体版本号) 第二步:卸载旧版本CUDA(如果有) 使用如下命令卸载旧版本CUDA,其中“x.y ”为需要卸载的旧版本号 $ sudo apt-get purge nvidia* $ sudo apt autoremove $ sudo apt-get remove cuda-x.y 注意:以上命令需要多次重复执行,卸载nvidia驱动和CUDA版本必须分别进行 第三步:安装依赖 $ sudo apt-get install build-essential $ sudo apt-get install cmake $ sudo apt-get install linux-headers-$(uname -r) $ sudo apt-get install freeglut3-dev 第四步:安装NVIDIA驱动 4.1 查看自己的NVIDIA显卡型号,在终端输入: $ lspci | grep -i nvidia 4.2 访问NVIDIA官网,选择对应的驱动程序下载,并执行以下命令: $ chmod +x NVIDIA-Linux-x86_64-xxx.xx.run #xxx.xx为驱动版本 $ sudo ./NVIDIA-Linux-x86_64-xxx.xx.run 第五步:环境变量设置 在用户的bashrc文件中设置CUDA和cuDNN的环境变量,打开终端执行以下命令: $ echo 'export PATH=$PATH:/usr/local/cuda/bin' >> ~/.bashrc $ echo 'export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64' >> ~/.bashrc (/usr/local/cuda安装CUDA的目录) $ source ~/.bashrc 第六步:测试 在终端执行以下命令,看到设备列表就表示安装成功 $ nvidia-smi 最后,安装CUDA过程中可能会遇到各种问题,要保持耐心,仔细阅读安装文档和报错信息,排除问题才能成功安装

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值