YOLO学习笔记3——训练阶段

训练阶段(反向传播)

拟合物体

深度学习、监督学习:通过梯度下降、反向传播方法迭代的微调神经元中的权重,使损失函数最小化。
YOLO检测速度非常快,标准版本的YOLO可以每秒处理 45 张图像
在这里插入图片描述

在这里插入图片描述
当有ground truth的中心点落在某一个grid cell中
对于该grid cell产生的2个bbox,由其中与ground truth(人工标注的真实标注框)IOU最大的那个bbox,来负责拟合物体。

当没有ground truth的中心点落在某一个grid cell中
对于该grid cell 产生的两个bbox,只需要让这两个bbox的置信度越接近于0。

损失函数

在这里插入图片描述

回归问题:
预测出一个连续的值,将该值与标注值进行比较。
第一项:负责检测物体的bbox中心点定位误差,定位误差比分类误差更大,所以增加对定位误差的惩罚,λcoord=5
第二项:负责检测物体的bbox宽高定位误差,带根号:同样的偏差,小框造成的损失函数会更大,大框造成的损失函数会更小。相比于大bounding box预测偏一点,小box预测偏一点更不能忍受。上图中带上标的是标注值,不带的是预测值,λcoord=5。
第三项:负责检测物体的bbox的confidence误差,其中的标签值是bbox与ground truth的iou,预测出的置信度应该和iou越接近越好。
第四项:不负责检测物体的bbox的confiden误差(包括1:负责检测物体的grid cell中不要的那个bbox,2:不负责检测物体的grid cell),训练时就会把这些网格里的框的“置信度”分数推到零,这往往超过了包含目标的框的梯度。从而可能导致模型不稳定,训练早期发散。因此要减少不包含目标的框的置信度预测的损失,使λnoobj=5 。
第五项:负责检测物体的grid cell分类误差越接近1越好

学习的视频地址:https://www.bilibili.com/video/BV15w411Z7LG?p=6

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值