yolov5 训练结果不稳定结果无法复现

最新推荐文章于 2024-05-19 13:17:02 发布

jasongag

最新推荐文章于 2024-05-19 13:17:02 发布

阅读量1w

点赞数 5

分类专栏： YOLOv5 文章标签： pytorch 深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jasongag/article/details/121706623

版权

YOLOv5 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

首先说明一下环境：

PyTorch 1.9 +CUDA 11
GPU NVIDIA GeForce RTX 3090 数量： 1 显存： 24 GB
CPU Intel Xeon Gold 6130H 内核： 8核
实例内存： 63G
硬盘 20.0G SSD
训练集2800张
验证集1200张
测试集600张

最近用yolov5跑项目，但是发现多次实验结果无法复现(同一个机器，同一份代码，同样超参数，但是验证集结果不同)，在测试集上跑的结果准确率可以偏差20%，其中认为可能的问题是出在以下几点：

1.Pytorch 的随机种子设置问题，但是Yolov5 的模型初始化时已经固定了随机种子。

2.因为是在云GPU上进行训练模型，所以可能会存在硬件不同的情况，硬件不同那随机的参数肯定也不同同。

3.训练集验证集与测试集之间关联性低

4.模型本身泛化能力不好

5.训练存在欠拟合

经过一个多礼拜的调试和实验，认为主要问题是出在模型本身参数太少了导致影响了多次训练后的模型推理精度。实验设计是yolov5n、yolov5s、yolov5m等多次训练查看方差（我测试了上百次T T），模型参数越大，结果越稳定，其中yolov5m测试10多次的精度差距在3%内。

关注

5
点赞
踩
19

收藏

觉得还不错? 一键收藏
23
评论
yolov5 训练结果不稳定结果无法复现

首先说明一下环境：PyTorch 1.9 +CUDA 11GPU NVIDIA GeForce RTX 3090 数量： 1 显存： 24 GBCPU Intel Xeon Gold 6130H 内核： 8核实例内存： 63G硬盘 20.0G SSD训练集2800张验证集1200张测试集600张最近用yolov5跑项目，但是发现多次实验结果无法复现(同一个机器，同一份代码，同样超参数，但是验证集结果不同)，在测试集上跑的结果准确率可以偏差20%，其中认为可能的问题是出在以下几点：1
复制链接

扫一扫

专栏目录

jasongag CSDN认证博客专家 CSDN认证企业博客

码龄8年

1: 原创

82万+: 周排名

52万+: 总排名

1万+: 访问

: 等级

40: 积分

2: 粉丝

5: 获赞

23: 评论

18: 收藏

私信

关注

热门文章

yolov5 训练结果不稳定结果无法复现 10491

分类专栏

YOLOv5 1篇

最新评论

yolov5 训练结果不稳定结果无法复现
北方的小狗儿: 啊我不是博主，不过回复你之后我在想应该是在train这个文件设置最好。
yolov5 训练结果不稳定结果无法复现
菜鸟的追梦旅行: 好久了啊，谢谢博主你的回答
yolov5 训练结果不稳定结果无法复现
北方的小狗儿: 在deteset试试呢
yolov5 训练结果不稳定结果无法复现
Rococo-W: 博主后来解决了吗？后期不是有个seed设置。我自己用的没啥效果
yolov5 训练结果不稳定结果无法复现
菜鸟的追梦旅行: 在train.py有一行代码 [code=python] init_seeds(2 + rank) [/code] 随机种子默认的应该是固定值的

最新文章

目录

评论 23

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。