Paddle分布式训练

本文基于paddleDetection,分布式训练模型

1.单卡训练与多卡训练,命令区别

单卡训练

python tools/train.py -c configs/ppyoloe/ppyoloe_plus_crn_m_80e_coco.yml --eval

多卡训练

python -m paddle.distributed.launch --gpus 0,1,2 tools/train.py -c configs/ppyoloe/ppyoloe_plus_crn_m_80e_coco.yml --eval

 2.环境安装

paddle使用GPU训练模型,需要安装显卡驱动、cuda、cudnn

基于以上环境,需要安装nccl

sudo  dpkg  -i  nccl-local-repo-ubuntu2004-2.8.4-cuda11.2_1.0-1_amd64.deb
sudo apt-get install libnccl2

sudo apt-get install libnccl-dev

3.配置环境变量

export LD_LIBRARY_PATH="/usr/local/cuda-11.2/lib64"
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/lib/x86_64-linux-gnu

4.刷新环境变量

source ~/.bashrc

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值