YOLO学习笔记3——训练阶段

最新推荐文章于 2024-05-06 11:20:24 发布

卖strawberry的小女孩

最新推荐文章于 2024-05-06 11:20:24 发布

阅读量2.7k

点赞数

分类专栏： yolo darknet 文章标签：深度学习计算机视觉人工智能

本文链接：https://blog.csdn.net/baidu_41906969/article/details/122176278

版权

darknet 同时被 2 个专栏收录

6 篇文章 1 订阅

订阅专栏

yolo

5 篇文章 0 订阅

订阅专栏

训练阶段（反向传播）

拟合物体

深度学习、监督学习：通过梯度下降、反向传播方法迭代的微调神经元中的权重，使损失函数最小化。
YOLO检测速度非常快，标准版本的YOLO可以每秒处理 45 张图像
在这里插入图片描述

在这里插入图片描述
当有ground truth的中心点落在某一个grid cell中：
对于该grid cell产生的2个bbox，由其中与ground truth(人工标注的真实标注框)IOU最大的那个bbox，来负责拟合物体。

当没有ground truth的中心点落在某一个grid cell中：
对于该grid cell 产生的两个bbox，只需要让这两个bbox的置信度越接近于0。

损失函数

在这里插入图片描述

回归问题：
预测出一个连续的值，将该值与标注值进行比较。
第一项：负责检测物体的bbox中心点定位误差，定位误差比分类误差更大，所以增加对定位误差的惩罚，λcoord=5
第二项：负责检测物体的bbox宽高定位误差，带根号：同样的偏差，小框造成的损失函数会更大，大框造成的损失函数会更小。相比于大bounding box预测偏一点，小box预测偏一点更不能忍受。上图中带上标的是标注值，不带的是预测值，λcoord=5。
第三项：负责检测物体的bbox的confidence误差，其中的标签值是bbox与ground truth的iou，预测出的置信度应该和iou越接近越好。
第四项：不负责检测物体的bbox的confiden误差（包括1：负责检测物体的grid cell中不要的那个bbox，2：不负责检测物体的grid cell），训练时就会把这些网格里的框的“置信度”分数推到零，这往往超过了包含目标的框的梯度。从而可能导致模型不稳定，训练早期发散。因此要减少不包含目标的框的置信度预测的损失，使λnoobj=5 。
第五项：负责检测物体的grid cell分类误差越接近1越好

学习的视频地址：https://www.bilibili.com/video/BV15w411Z7LG?p=6

卖strawberry的小女孩

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
5
评论
YOLO学习笔记3——训练阶段

训练阶段（反向传播）拟合物体深度学习、监督学习：通过梯度下降、反向传播方法迭代的微调神经元中的权重，使损失函数最小化。当有ground truth的中心点落在某一个grid cell中：对于该grid cell产生的两个bbox，由其中与ground truth(人工标注的真实标注框)IOU最大的那个bbox，来负责拟合物体。当没有ground truth的中心点落在某一个grid cell中：对于该grid cell 产生的两个bbox，只需要让这两个bbox的置信度越接近于0。损失函数
复制链接

扫一扫

专栏目录