U版yolov3调用DDP训练

最新推荐文章于 2024-06-13 16:47:00 发布

慕思侣

最新推荐文章于 2024-06-13 16:47:00 发布

阅读量918

点赞数 2

分类专栏： yolo 文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014090429/article/details/116755242

版权

yolo 专栏收录该内容

16 篇文章 1 订阅

订阅专栏

模型训练

训练根据计算资源(显卡)的情况，主要分3种: 单机单卡, 单机多卡，多机多卡。

需要说明的是，Yolo v5的作者采用的不是熟悉的DP模式torch.nn.DataParallel，而是torch.nn.parallel.DistributedDataParallel, 即DDP模式。按照PyTorch官方的说法[3]: 即使在单机多卡的环境，也推荐DDP模式，DDP模式会显著快于DP模型，关于DDP的例子可见官网[4].

单机单卡训练:

python train.py --img 640 --batch 16 --epochs 5 --data ./data/coco128.yaml --cfg ./models/yolov5s.yaml --weights ''

单机多卡训练:

python train.py --img 640 --batch 16 --epochs 5  --data ./data/coco128.yaml --cfg ./models/yolov5s.yaml --weights '' --device 0,1 # 指定第1,2块卡进行训练

多机多卡训练:

python -m torch.distributed.launch --nproc_per_node 2 train.py --weights yolov5s.pt --data ./data/coco128.yaml --cfg ./models/yolov5s.yaml --epochs 3 --img 320 --device 0,1 # DDP

参考资料：https://blog.csdn.net/g11d111/article/details/108872076

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

慕思侣 CSDN认证博客专家 CSDN认证企业博客

码龄11年

113: 原创

5万+: 周排名

3万+: 总排名

36万+: 访问

: 等级

3087: 积分

107: 粉丝

355: 获赞

72: 评论

1503: 收藏

私信

关注

热门文章

分类专栏

ubuntu 10篇
环境配置 10篇
onnxruntime 3篇
c/c++ 1篇
caffe 10篇
代码管理 6篇
docker 8篇
模型轻量化 3篇
python 13篇
onnx 5篇
enflame
深度学习 11篇
xshell 2篇
faster rcnn 3篇
IDE 1篇
图像处理 7篇
tensorflow 6篇
tensorrt 2篇
pytorch 2篇
darknet 2篇
人脸检测/识别 3篇
yolo 16篇

最新评论

pytorch小记：nn.ModuleList和nn.Sequential的用法以及区别
weixin_43469567: 好多细节定义时候的数字和运行结果都对不上
ubuntu普通用户不显示用户名及主机名，只有一个‘$’
fufu39: 已解决
ModuleNotFoundError:No module named “te_fusion“
TXDNAA: arm架构的可以看看/usr/local/Ascend/ascend-toolkit/latest/aarch64-linux/lib64
pytorch小记：nn.ModuleList和nn.Sequential的用法以及区别
quitter96: 模块注册问题：由于 linears 是一个局部变量，而不是实例变量，它不会被正确地注册为模型的一部分。这意味着 linears 中的 nn.Linear 层不会被正确地注册为模型的子模块，可能会导致一些潜在的问题，例如在保存和加载模型时出现问题。总结代码1：正确地将 linears 定义为实例变量 self.linears，使得它可以在类的其他方法中被访问和使用，并且会被正确地注册为模型的一部分。代码2：错误地将 linears 定义为局部变量，虽然在 forward 方法中可以直接访问 linears，但这并不是一个好的做法，因为它依赖于 Python 的作用域规则，并且不会被正确地注册为模型的一部分。
pytorch小记：nn.ModuleList和nn.Sequential的用法以及区别
quitter96: 代码1 class net1(nn.Module): def __init__(self): super(net1, self).__init__() self.linears = nn.ModuleList([nn.Linear(10,10) for i in range(2)]) def forward(self, x): for m in self.linears: x = m(x) return x 在代码1中，linears 被定义为 self.linears，这意味着 linears 是一个实例变量（即类的属性）。这样做的好处是，linears 可以在类的其他方法中被访问和使用，例如在 forward 方法中。由于 self.linears 是一个 nn.ModuleList，它会被正确地注册为模型的一部分，并且其中的每个 nn.Linear 层也会被正确地注册为模型的子模块。代码2 class net1(nn.Module): def __init__(self): super(net1, self).__init__() linears = nn.ModuleList([nn.Linear(10,10) for i in range(2)]) def forward(self, x): for m in linears: x = m(x) return x 在代码2中，linears 被定义为一个局部变量，而不是实例变量。这意味着 linears 只在 __init__ 方法的作用域内有效。虽然在 forward 方法中可以直接访问 linears，但这并不是一个好的做法，原因如下：作用域问题：linears 是一个局部变量，而不是实例变量。虽然在 forward 方法中可以直接访问 linears，但这依赖于 Python 的作用域规则，可能会导致代码的可读性和可维护性降低。模块注册问题：由于 linears 是一个局部变量，而不是实例变量，它不会被正确地注册为模型的一部分。这意味着 linears 中的 nn.Linear 层不会

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。