【问题记录】YOLOv5继续训练时精度损失问题解决

最新推荐文章于 2024-04-23 01:33:40 发布

果果粒粒

最新推荐文章于 2024-04-23 01:33:40 发布

阅读量1.6k

点赞数 23

分类专栏：问题记录文章标签： YOLO 深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Mecaly/article/details/135388413

版权

问题记录专栏收录该内容

11 篇文章 0 订阅

订阅专栏

【问题记录】YOLOv5恢复训练时精度损失问题解决

1. 会产生精度损失的训练过程
- 1.1 修改部分
- 1.2 训练结果展示
2. 减少精度损失的训练过程
- 2.1 修改部分
- 2.2 训练结果展示

1. 会产生精度损失的训练过程

1.1 修改部分

修改 train.py 中的超参数 epochs ， resume 的默认值为 default=True.
在 utils/torch_utils.py 中的 smart_resume 函数中添加 ckpt['epoch'] = 299（此处的数值为训练完成的 epochs 数）
在 exp/opt.yaml 中修改 epochs 数后训练。

1.2 训练结果展示

从下面展示的精确度和 lr 的曲线图可以看到，在恢复训练之后精度会出现大幅度降低的现象。
精确度-曲线图
lr-曲线图

2. 减少精度损失的训练过程

上面直接修改超参数 resume 恢复训练会出现精度损失，从现象上看是因为继续训练之后的 lr 比断点处的 lr 大很多导致的。针对这个想法，减少精度损失可以从 lr 下手，即在恢复训练时将 lr 修改为断点处的 lr 值。下面展示详细的修改过程。

2.1 修改部分

修改 train.py 中的超参数 epochs ， resume 的默认值为 default=True.
在 utils/torch_utils.py 中的 smart_resume 函数中添加 ckpt['epoch'] = 299（此处的数值为训练完成的 epochs 数）
在 exp/opt.yaml 中除了修改 epochs 之外修改 lr0 和 lrf 为断点处的值（断点处的 lr 值可在 results.csv 中查看）。
注：若后续需要正常训练，训练完成后及时恢复代码修改。

2.2 训练结果展示

精确度-曲线图
lr-曲线图
可以看到精确度和 lr 曲线图都衔接了之前的训练结果。
此外，由于 yolov5-7.0 默认 lr 为线性下降，在 train.py 中可见代码如下。
```
if opt.cos_lr:
	lf = one_cycle(1, hyp['lrf'], epochs)  # cosine 1->hyp['lrf']
else:
	lf = lambda x: (1 - x / epochs) * (1.0 - hyp['lrf']) + hyp['lrf']  # linear
scheduler = lr_scheduler.LambdaLR(optimizer, lr_lambda=lf)  # plot_lr_scheduler(optimizer, scheduler, epochs)
```
- 为了保持尽可能一致的学习率，需将 hyp['lrf'] 替换为默认的初始 lrf 值。
- 在计算线性下降的学习率时，由于完成训练后继续训练的 epochs 数只会比之前的大，且lf = (1 - x / epochs) * (1.0 - hyp['lrf']) + hyp['lrf'] = 0.1 - 0.09 * (x / epochs)（hyp['lrf'] 的初始值为0.01），所以 300 epochs 的学习率斜率比 400 epochs 的大，导致 lr 斜率不一致，所以训练完成后接着训练需要根据具体情况进行学习率的调整。

关注

23
点赞
踩
28

收藏

觉得还不错? 一键收藏
4
评论
【问题记录】YOLOv5继续训练时精度损失问题解决

YOLOv5继续训练时精度损失问题解决
复制链接

扫一扫

专栏目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。