解决YOLOv7训练loss值为nan，P、R、mAP为0的情况

最新推荐文章于 2024-08-21 16:56:45 发布

小琪顺利毕业

最新推荐文章于 2024-08-21 16:56:45 发布

阅读量2.1k

点赞数 5

文章标签： YOLO 目标检测深度学习计算机视觉

本文链接：https://blog.csdn.net/weixin_45992778/article/details/136660815

版权

我是Yolov7可以跑通的，但是再修改了损失函数之后，在训练15-20轮时loss值为nan，P、R、mAP为0。搜了好多教程，只有这一个对我来说有用：
不用修改train.py，在detect.py中将half = device.type != ‘cpu’ 改成half = False 就可以了！！
在这里插入图片描述参考教程

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小琪顺利毕业

关注关注

5
点赞
踩
12

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

YOLOV5/v7/v8训练数据集P、R、mAP等均为0

weixin_61623830的博客

09-14

3084

时选择的路径）4.查看系统变量中的Path是否有v12.2\bin，若没有则添加正确路径；若错误则修改成正确路径（路径为。

yolov7训练时出现损失为nan的解决方案

XIANGTAIYANGA的博客

04-08

938

另外一种解决方案，报错中第一句提到一个文件：libiomp5md.dll，这个文件可以在虚拟环境文件目录下搜索，会有两个结果，其中一个存在于（我的虚拟环境为yolov7）如下图所示，另一个不用管。即在train.py文件的最开始加上上述两句语句，可以解决报错，即开始训练，但是所有的损失值均为nan，报错中最后也有提示"可能导致崩溃或带来不正确的结果"，因此这种解决方案就不一定正确。在训练yolov7模型时，一直出现损失值为nan的情况，因此将解决方案供大家参考一下。因此，继续寻找解决方案。

1 条评论您还未登录，请先登录后发表或查看评论

YOLO系列训练时出现loss出现nan值或者测试时P\R\map全部为0值

xu96944967的博客

05-05

1846

安装cuda，cuda换为10.2的版本，注意如果已经安装cuda需要选自定义安装，只选择第一项cuda。然后继续安装pytorch cu102版本。把这三个文件夹，里的内容分别放在。解压下再好的cudnn。

补充：YOLO模型训练时loss出现nan值或者测试时P\R\map全部为0值的解决办法（GTX16xx系列显卡）

lwx的博客

07-29

5394

YOLO系列训练时出现loss出现nan值或者测试时P\R\map全部为0值的解决办法补充

yolov8在设置amp=False 之后map 训练依旧为0 解决办法

网络架构

09-16

6846

找到torch_utils.py 修改425行去掉 half()

YOLOV5训练数据集P、R、mAP等均为0的解决方案！！！【速进】

weixin_43249462的博客

03-05

7361

可以识别到label，但是P,R,map这些地方都是0，如果确保数据原图和标签是匹配的，或者上传的文件也不是损坏的，那就有可能是梯度的问题了。如果你的代码跟我的有点不一样，没关系是因为yolov5的作者一直在维护升级代码，找到对应位置把默认的SGD优化器改成Adam就可以啦！yolov5默认使用的是SGD优化器，所以我们要改成Adam优化器，Adam优化器也是yolov5封装好的，很简单。如果你的程序跟我的一样的话，参数是这样的。

yolov8 出现loss 为nan

zhaoluruoyan89的博客

08-21

1540

这篇博客警示读者在购买用于深度学习的显卡时要避开那些导致RuntimeWarning: All-NaN slice encountered的问题。作者强调这些Tensor核心存在严重缺陷，不适宜进行深度学习任务，建议大家在选购时务必谨慎。方法二：将混合精度训练AMP 设置为False。方法一：降低cuda和pytorch 版本号。

解决Yolov8训练train时box_loss cls_loss dfl_loss为nan和 Box(P R mAP50 mAP50-95)为0问题和wandb.errors.UsageError

qq_45683122的博客

06-16

2267

Yolov8在训练时box_loss cls_loss dfl_loss为nan和 Box(P R mAP50 mAP50-95)为0的问题第一步：找到ultralytics\cfg\default.yaml中的default.yaml文件将default.yaml中的amp设置为false将default.yaml中的half设置为false第二步：找到ultralytics\engine\validator.py中的validator.py文件。

yolov8在train时，出现box_loss、cls_loss、dfl_loss为nan，Box(P R mAP50 mAP50-95)为0的解决办法

热门推荐

2301_78783836的博客

07-04

1万+

'cpu' 将self.args.half的值设置为False 后训练yolov8n Box(P R mAP50 mAP50-95)不为0。并注释掉ultralytics/yolo/engine/validator.py 中第102行代码 # self.args.half = self.device.type!分析.half()改为.float()或者把half赋值为False，找到val.py和validator.py。查看self.args.half:的值的结果。

yolov7的loss计算代码详解

guanshanjushi2的专栏

08-03

6944

yolov7详解

YOLOv5s GTX 1660 Ti训练时出现，box，obj，cla全是nan的问题P、R、mAP都是0，Pytorch和cuda、cudnn版本不对

idl1ng的博客

05-04

1619

cudnn版本：8.2.2（或者8.2.4）训练显示box、obj、cls都是nan。pytorch版本：1.9.0。Pytorch版本：1.9.0。Pytorch版本：1.9.0。cudnn版本：8.0.5。cudnn版本：8.2.2。cuda版本：11.1。cuda版本：11.4。cuda版本：10.2。

YOLOv6跑自己的数据集mAP为0的解决

qq_52060635的博客

12-03

985

【代码】YOLOv6跑自己的数据集mAP为0的解决。

YOLOV5训练时P、R、mAP等值均为0的问题

qq_65356682的博客

04-06

1万+

需要注意的是，P、R、mAP等指标为0并不一定意味着模型无效。训练时间太短：如果训练时间太短，则模型可能没有足够的时间来收敛到最佳状态。模型过于简单：如果模型过于简单，则很难从样本中学习到有效的特征。考虑增加网络的深度和宽度，或使用更复杂的网络结构。预处理步骤出现问题：确保数据预处理流程正确，例如确保使用正确的缩放方式和颜色空间转换，以及应用正确的数据增强策略。学习率过高或过低：首先尝试将学习率降低到一个更合适的水平，并考虑使用学习率调度程序来优化训练过程。

【YOLO】解决YOLOX训练时AP为0

MangoloD的博客

08-12

1万+

前段时间被YOLOX刷屏了，各个公众号都在强推，号称：性能超Yolov5，吊打一切YOLO 于是，我满怀期待，下载下源码，准备试一试．．．一、问题描述嗯，没错，遇到了一堆bug，不过好在都解决了，最后训练的时候好家伙，AP一直为0，上GIthub上一搜索，看来遇到同样问题的不止我一个而且根据有些答复修改，发现也不对，最后陷入沉思．．．直到昨天群组里偶然有人说他用YOLOX成功还部署了，我就呆了，告诉了他我训练时AP为0，并询问了他具体使用方法，当然得到的答复并没有真正解决问题．．．二、发现问题

跑yolov5又出啥问题了（1）p，r，map全部为0

weixin_50862344的博客

08-01

7878

来看若智人（我）了

YOLOv5训练时出现loss出现nan值或者测试时P\R\map全部为0

Z924471842的博客

02-26

1414

用GPU训练YOLOv5时mAp值为0的解决方法

解决YOLOV5训练时P、R、mAP等值均为0的问题

GeniusAng的博客

06-20

1万+

解决YOLOV5训练时P、R、mAP等值均为0的问题

解决YOLOV5训练时P、R、mAP等值均为0

daofeng56的博客

10-11

4587

解决YOLOV5训练时P、R、mAP等值均为0，除了环境问题之外的错误

yolov11训练mAP为0

最新发布

03-08

### YOLOv11 训练 mAP 为 0 的原因分析在YOLOv11训练过程中遇到mAP为0的情况可能由多种因素引起。常见原因之一是数据集配置不当，包括但不限于图像与标注文件不匹配或存在损坏文件[^3]。另一个潜在原因是使用的PyTorch版本不合适，这可能导致模型无法正确收敛，从而影响性能评估指标如精确率(Precision, P)、召回率(Recall, R)，以及平均精度均值(mAP)[^3]。此外，优化算法的选择也至关重要。默认情况下，某些YOLO实现可能会采用随机梯度下降(SGD)作为优化方法；然而，在特定场景下切换至自适应矩估计(Adam)优化器能够显著改善训练效果，尤其是在初始阶段有助于更稳定的学习过程[^4]。硬件环境同样不容忽视。有报告指出特定型号GPU可能存在兼容性问题，进而引发诸如验证损失(loss)变为NaN或是mAP异常的现象[^2]。 ### 解决方案建议针对上述提到的各种可能性，可以采取如下措施来尝试解决问题： #### 数据校验确保用于训练的数据集无误，特别是要仔细核对图片路径及其对应的标签信息是否一一对应，并排除任何可疑的破损样本。 #### 调整依赖库版本检查当前环境中安装的深度学习框架版本号，必要时调整至官方推荐或者社区反馈表现良好的组合。 #### 更换优化器设置考虑修改默认的优化策略，例如通过命令行参数`--adam`启用Adam优化器替代原有的SGD选项，以此观察是否有正面变化。 ```bash python train.py --adam ``` 对于源码级别的定制化需求，则需定位到相应函数定义处（通常是`train()`），手动更改内部调用逻辑以支持所需变更。 #### 环境适配测试如果怀疑问题是由于特定图形处理器引起的，不妨尝试更换不同类型的计算资源来进行对比实验，看能否规避该类错误的发生。最后值得注意的是，尽管这里讨论的内容主要围绕YOLO系列早期版本展开，但对于最新版YOLOv11而言，原理上仍然适用，只是具体操作细节会有所差异。